スキップしてメイン コンテンツに移動

投稿

あたらしい道具

今晩和。 またまた御無沙汰しております。 きょうは、大変おもしろい『道具』に出逢ったので、その御紹介を。 その道具とは “TensorBoard” です。 詳しくは、以下のリンクのページを熟読なさってください。 https://yag-ays.github.io/project/embedding-visualization/ この分析ツールを使ってみるために、国連の『世界人権宣言』を mecab で分かち書きにしてから word2vec に通してみました。 わたしは門外漢なので、あまりよく分かっていませんが、要はこれ、主成分分析(PCA)ですね。いや、オプションで t-SNE という「学習」にも切り替えられますが。 なんで、こんなツールを探し出して使ってみたかというと、実は仕事上の必要から、大量の文献の調査をしているのです。ところがアタマがパンクしそうになるくらい大量で困っていたのでした。そこで、要領よく文献を精査するために、キーワード検索を多用しようか、と云う段階になりました。 そうすると、とあるキーワードに「距離的に近い」別のキーワード群を知りたいと思ったのです。そこでネットを散策していたら上記のページに行き当たり。 上記の例では、対象が『世界人権宣言』ですので、まあ、ドキュメントの量としても短いし、出てくる単語の語彙も限られていて、いわゆる予想どおりの結果になっております。 ですが、これを不特定多数のドキュメント群に対して施したときに、どうなるか? まだ、わたしには分かりません。 ですが、確かな手応えを感じています。 こんなツールが、ちょっと環境を整えるだけで使える時代。 ああ、ほんとうに良くなりました。 感謝深甚です。 追記: 手持ちの参考文献をすべて .txt にして、TensorBoard で可視化してみました。 これはスゴい! 便利です。
最近の投稿

「情報処理」の根本に立ち戻る

今日和。 またまた御無沙汰しております。 如何お過ごしでしょうか。 わたしが住む地域は比較的、好い陽気が続いており、ありがたく思っています。 初老も迎えた小生、とてもとても「不惑」に達したなどとは云えず、いろいろと物思う日々を送っている次第です。 先日から何冊か、結城 浩 氏の著作を読んだり読み直したりしておりました。 学生時代から雑誌連載を通じてお世話になってきた、私淑の師のひとりです。 今回は『文章作法』や『デザ・パタ本』を読んだのですが、そこで語られている内容そのものより、その背後にある《暗黙の前提》が気になりました。 たとえば『文章作法』は執筆術です。 ですが、それは「書いてあること」をどのように読み取るか/読み取らせるか、の 《読解術》 であるように感得されました。 『デザイン・パターン』はプログラミングするときの処理の類型です。 ですが、こちらも「プログラム」に留まらず、取得した情報をどのように加工して望みの結果を得るか、という 《情報処理術》 に見えました。 そもそも 《情報処理》 とはなんであるか? 現行のパラダイムでは 「入力された情報を、なんらかのアルゴリズムによって処理して、計算結果を出力する」 ということになります。大学で「情報科学」や「情報工学」と銘打った授業は多数ありますが、それらの分野を、たんなる「コンピューターの使い方」として受け取るのは、非常に勿体ない気がするのです。 むしろ、 情報処理とは、人間の生存・生産活動において必須の、重要なプロセスについての【抽象化 】 ではないか と。 書店に出かけると『アルゴリズムとデータ構造事典』みたいな本を売っています。 あれを単なるレシピ集としてだけ読むのは損だと思うのです。そうではなく、あれはもっと応用範囲のひろい、 『「仕事のやり方」の虎の巻』 ではないかと。現実の人生や仕事で直面する諸問題を、いかに 《モデル化》 し、それを一定の手続きのもと処理し、望みの結果を得るか、というのは、単に「情報処理」だけのパラダイムではなく、 『作業』そのもののパラダイム なのだと痛感するようになりました。 だって、もともと「情報処理」は現実に存在する諸問題を、抽象的にモデル化して、処理して解決するために生まれてきた学問なのですから。 だから

霞ヶ関文学の劣化ぶりを垣間見る——『一事が万事?』——

おはようございます。 ちょっと古い(半年前くらいの)トピックなんですが、看過できないものを見かけました。そこで所感をまとめておきます。 【経済産業省】:DXレポート ~ITシステム「2025年の崖」克服とDXの本格的な展開~ https://www.meti.go.jp/shingikai/mono_info_service/digital_transformation/20180907_report.html どうも、あまりにも問題が多すぎるレポートです。 ですから『本文』.PDF の 27 ページに話を絞って、分析します。 https://www.meti.go.jp/shingikai/mono_info_service/digital_transformation/pdf/20180907_03.pdf 『(注)経済損失の算出根拠』からの文章を、じっくりとお読みください。 私見では、まことしやかに数字を列挙しながら「試算」を進めている、この注釈。 論理的な妥当性には、かなり乏しいです。 この「試算」は、3 つの統計調査の引用でできあがっています。 情報処理推進機構(ベースは他社による調査) 日経 BP 社「日経コンピュータ 2017.8.3」の記事 日本情報システム・ユーザー協会「企業 IT 動向調査報告書 2016」 ですが、それらを並べて試算している、そのやり方が微妙にオカシイのです。 まず、これは前提として(仕方なく、)仮に許しましょう。 1. > データ損失やシステムダウン等の システム障害により生じた 2014 年 1 年間の損失額は国内全体で約 4.96 兆円。 つまり、既に 5 年前の段階で年間あたり約 5 兆円の損失を(レガシー系に代表される基幹系システムは)計上している訳です。  次に、ここが要注意です。 2. > (1)セキュリティ 29.1%、 > (2)ソフトの不具合 23.1%、 > (3)性能・容量不足7.7%、 > (4)人的ミス 18.8%、 > (5)ハードの故障・不慮の事故 19.7%。 > レガシーシステムに起因して起こる可能性があるのは、仮に、このうち (1)・(2)・(3)・(5) と

『神のゲーム』

おはようございます。 またまた御無沙汰しております。 今朝はこんな、“Nature” への投稿を見かけました。 有料会員ではないのでアブストしか読んでませんが、若い頃考えていたことをふと想起しましたので、ちょっとメモしておきます。 https://www.nature.com/articles/s41586-019-1043-4 私は世代的にそうなのか、御多分にもれず gamer 世代です。 とある失意をきっかけに一切コンピューター・ゲームをしなくなりましたが、やっぱり「ゲーム」の影響は強く、一方では SF 小説の乱読もしていたので、ずいぶんと夢見がちな学生でした。 わたしは卒業研究(Inverse Kinematics の implementation)のかたわら、ゲーム業界に就職できないものかどうかと企画を練っていました。そのとき思いついたのが『進化ゲーム』です。それは当時流行だった『複雑系』や『遺伝的アルゴリズム』といった概念をエンターテインメントのかたちに落とし込んだ『社会シミュレーション』のゲーム企画でした。 タイトルは『だいばーしちー』でした。 詳細は省きますが、わたしは『人類の進化の歴史』に強い興味を覚えていたのです。 そして、それが今後どのようになるのかにも、若干の危惧を伴いながら希望を抱いていました。その『仕組み』が知りたかった。 それよりちょっと昔に『ぶたさん』という、たいへん愉快なゲームがありました。 ぶたさんたちが爆弾を投げ合う無差別ドッジボールのような。 わたしはそこで『薬』と『毒』を投げ合うゲームにアレンジしたらどうなるか、夢想しました。 世に「酒は百薬の長」とも「百毒の長」とも申しますが、あんな感じです。 しかも 薬は薬として効くことが多いが毒にもなる 毒は毒として効くことが多いが薬にもなる ことを『だいばーしちー』の基本ルールとしました。 プレイヤーは n 人で、それぞれ、いくつかの属性に代表された「性格」を持っています。 怒りんぼだったり、のんびり屋さんだったり。 利他的だったり、利己的だったり。 薬が効きやすかったり、毒が効きやすかったり。 これは「贈与と収奪」のゲームです。 そして、隠れ属性として、カンタンな遺伝子コードを持たせます。 面をクリ

「子供向き」には留まらない想像力

今晩和。 実は Scratch で細々とした作例を積み重ねています。 どうですか、これは? https://scratch.mit.edu/projects/284763417 これは惑星軌道(今回は地球と金星)のあいだに線分を描画しつづけたときにできる『軌跡』です。惑星半径や公転周期などは『理科年表』を参考にしました。有効数字(数値としての具体性)を 5 桁ぐらいにしたら、こんな綺麗な模様ができました。桁数を下げると、また、似て非なる模様になります。 「子供用」とされているプログラミング環境でも、発想次第でいろんなことができる。 自戒とするところです。

挑戦権をみずから放棄した社会

御無沙汰しております。 お元気でしたか? こちらは本業の案件が二転三転しており、なかなかやるせない日々です。 そんな日々の中、書物を紐解いています。 先程読み終えたのが、あの新井 紀子 先生の 『AI vs. 教科書が読めない子供たち』 という警醒の書です。 たいへん愉しく読み進めたのですが、同時に、自分は文章を「読解」できているのか不安になりましたね。『帽子をかぶった女の子がいる』の例題で誤答してしまったためです。命題として考えれば対偶を取ったり、ベン図(集合論)を書けば理解できそうなことをサボって間違えてしまいました。 わたしは近年、教育分野に関心を持って活動してきたのですが、その過程での流行り廃りで、「リメディアル教育」だの「早期英語教育」だの、「アクティヴ・ラーニング」「リベラル・アーツ」「プログラミング教育」といったキャッチ・フレーズが巷間を賑わせてきたのを眺めてきました。 ですが、そういったキャッチ・フレーズたちは表面を撫でるようなものでしかなく、結局(新井先生の言うとおり) 『文章の読解力こそが決め手』 であることに得心しました。 まあ、自分も御多分にもれず AI 関連技術(GAN とか RNN とか)は独学しています。 めざましい躍進が各所から伝えられているのは、みなさんも御存知の通りです。 ですが、そういった華々しいところからは見えない 『本質的困難さ』 、これを直視しなければなりません。 自分は高校の頃、神林 長平の『敵は海賊』シリーズなど SF を愛読して、人工知能研究者を目指していたのですが大学入学直後、『人工知能辞典』でドレイファスの否定的見解にふれ、そこから迷走を始めました。'92 年の話です。当時はマシン・パワーも現代に比べ格段に非力で、取り扱い可能データ量も少なく、今日のように機械学習(深層学習)が力を発揮することなどありえませんでした。 ですから、いまの AI 関連トピックを傍らから眺めていると、隔世の感が強いのです。 それで多少は手遊びで、それらの技術を独学しているのですが、どうも、わたしにはここまでの blank を catch up できるだけの才能はないようなのです。 ですが、個人的にまだまだ生き残らなければならない理由がある

過ちては則ち改むるに憚ること勿れ

今晩和。 実は、こどもプログラミング教室に関わりはじめました。 そこで Scratch 言語についての見解を改めねば、と思ったのです。 実際に Scratch に触って、そのブロック構造を組み合わせたプログラミングを体験してみると、多角形や角丸長方形などを使い分けたシンボリックなブロック群が、そのまま処理構造の可能性を暗示していて、かなりオモシロくプログラミングを学習できるのです。 それと、ある程度の範囲でコーディングできるだけのブロックは整備されているので、モンテカルロ法のシミュレーションや、フラクタル図形の描画など、それなりにテクニカルなことはできてしまうのです。もちろん、ちいさい子供たちの多くは、思いおもいにゲームや便利ツールを作るのですがね。 システム開発はある程度、処理系依存の部分が大きい、とはいまだに感じてますが、それでも Scratch は非常にオモシロい学習用プログラミング言語で、その可能性はかなり広い範囲に及んでいる、と考えを変えました。 それにしても、こどもの面倒を見るって興味深いことですね。