データ可視化に特化すべき

おはようございます。
随分と御無沙汰しておりました。
本業でバタバタとしておりまして。ようやく落ち着いたところです。

それにしても独学がなかなか進みませんね。
仕事も〆切に向かって忙しかったし、リゾーム状にいろんな方面に手を出しつつですから。

ただ、そこで肚に決めたことがあります。
自分は「データの可視化に特化すべきである」と。
勿論、そのメイン・ターゲットであるデータ・サイエンスの通習はします。
でも、自分の強みは分析者として、ではなく、分析されたデータを可視化することにある、と。
微妙な違いですね。（苦笑）

というのも、やっぱりなんだかんだ言って、長年 3DCG の技術者（デザイナー）として研鑽を積んできたので、それを活かすかたちで近未来の展開を考えたほうがイイと考えたからなのです。

自分の強みはなにか？
すくなくとも自分の専門に於いては、洋書を読むことが苦でないことです。
これで国内にいても数年程度の差は付けられる。
すこしはアドヴァンテージになる、というものです。

それにいまどきは以下のような書籍について、定額会員コースがあります。
もう、乱読の環境は整っているのです。
https://ssearch.oreilly.com/?q=visualization
https://search.packtpub.com/?query=Visualization&refinementList%5Breleased%5D%5B0%5D=Available

昨夜は就寝前、データ可視化にかんするいくつかの言語の電子書籍の頁を繰りました。
MATLAB, Mathematica, D3.js, Processing 2, ......
時代は変わりましたよね。二十年前はいろいろと自作しなければならなかったのですから。あとは 3D 系で Unity/Unreal といったところでしょうか。

これからも SE+PG としての復帰を目指して自学します。

そうそう。
放送大学の学部に入学しました。
ええ、「学部」です。
これから８年ぐらいたっぷりとかけて、諸学問をやり直します。
すでに学界で枯れた知見になっているのに知らないで損をしていること、たくさんあると感じているのです。

このブログの人気の投稿

過ちては則ち改むるに憚ること勿れ

今晩和。実は、こどもプログラミング教室に関わりはじめました。そこで Scratch 言語についての見解を改めねば、と思ったのです。実際に Scratch に触って、そのブロック構造を組み合わせたプログラミングを体験してみると、多角形や角丸長方形などを使い分けたシンボリックなブロック群が、そのまま処理構造の可能性を暗示していて、かなりオモシロくプログラミングを学習できるのです。それと、ある程度の範囲でコーディングできるだけのブロックは整備されているので、モンテカルロ法のシミュレーションや、フラクタル図形の描画など、それなりにテクニカルなことはできてしまうのです。もちろん、ちいさい子供たちの多くは、思いおもいにゲームや便利ツールを作るのですがね。システム開発はある程度、処理系依存の部分が大きい、とはいまだに感じてますが、それでも Scratch は非常にオモシロい学習用プログラミング言語で、その可能性はかなり広い範囲に及んでいる、と考えを変えました。それにしても、こどもの面倒を見るって興味深いことですね。

あたらしい道具

今晩和。またまた御無沙汰しております。きょうは、大変おもしろい『道具』に出逢ったので、その御紹介を。その道具とは “TensorBoard” です。詳しくは、以下のリンクのページを熟読なさってください。 https://yag-ays.github.io/project/embedding-visualization/ この分析ツールを使ってみるために、国連の『世界人権宣言』を mecab で分かち書きにしてから word2vec に通してみました。わたしは門外漢なので、あまりよく分かっていませんが、要はこれ、主成分分析（PCA）ですね。いや、オプションで t-SNE という「学習」にも切り替えられますが。なんで、こんなツールを探し出して使ってみたかというと、実は仕事上の必要から、大量の文献の調査をしているのです。ところがアタマがパンクしそうになるくらい大量で困っていたのでした。そこで、要領よく文献を精査するために、キーワード検索を多用しようか、と云う段階になりました。そうすると、とあるキーワードに「距離的に近い」別のキーワード群を知りたいと思ったのです。そこでネットを散策していたら上記のページに行き当たり。上記の例では、対象が『世界人権宣言』ですので、まあ、ドキュメントの量としても短いし、出てくる単語の語彙も限られていて、いわゆる予想どおりの結果になっております。ですが、これを不特定多数のドキュメント群に対して施したときに、どうなるか？まだ、わたしには分かりません。ですが、確かな手応えを感じています。こんなツールが、ちょっと環境を整えるだけで使える時代。ああ、ほんとうに良くなりました。感謝深甚です。追記：手持ちの参考文献をすべて .txt にして、TensorBoard で可視化してみました。これはスゴい！便利です。

霞ヶ関文学の劣化ぶりを垣間見る——『一事が万事？』——

おはようございます。ちょっと古い（半年前くらいの）トピックなんですが、看過できないものを見かけました。そこで所感をまとめておきます。【経済産業省】：DXレポート　～ITシステム「2025年の崖」克服とDXの本格的な展開～ https://www.meti.go.jp/shingikai/mono_info_service/digital_transformation/20180907_report.html どうも、あまりにも問題が多すぎるレポートです。ですから『本文』.PDF の 27 ページに話を絞って、分析します。 https://www.meti.go.jp/shingikai/mono_info_service/digital_transformation/pdf/20180907_03.pdf 『（注）経済損失の算出根拠』からの文章を、じっくりとお読みください。私見では、まことしやかに数字を列挙しながら「試算」を進めている、この注釈。論理的な妥当性には、かなり乏しいです。この「試算」は、3 つの統計調査の引用でできあがっています。情報処理推進機構（ベースは他社による調査）日経 BP 社「日経コンピュータ 2017.8.3」の記事日本情報システム・ユーザー協会「企業 IT 動向調査報告書 2016」ですが、それらを並べて試算している、そのやり方が微妙にオカシイのです。まず、これは前提として（仕方なく、）仮に許しましょう。 1. > データ損失やシステムダウン等のシステム障害により生じた 2014 年 1 年間の損失額は国内全体で約 4.96 兆円。つまり、既に 5 年前の段階で年間あたり約 5 兆円の損失を（レガシー系に代表される基幹系システムは）計上している訳です。次に、ここが要注意です。 2. > (1)セキュリティ 29.1%、 > (2)ソフトの不具合 23.1%、 > (3)性能・容量不足7.7%、 > (4)人的ミス 18.8%、 > (5)ハードの故障・不慮の事故 19.7%。 > レガシーシステムに起因して起こる可能性があるのは、仮に、このうち (1)・(2)・(3)・(...

データ・サイエンティストは可視化の夢を見るか？

このブログを検索