機械学習の学習をしていて厄介に思うのが、だいたいありとあらゆる操作がCUIベースということ。
WEBアプリケーションを作っているので、CUIそのものは抵抗感がないのだが、可視化とか特徴量エンジニアリングの際に、実際は「エクセル的な作業」が大部分なのに、その作業に対応したコマンドや引数を思い出さなければいけない。
正直、「ここがGUIの出番でしょう!」と言いたくなってしまう。
例えば、オフィス系アプリケーションの感覚で機械学習が進められるプラットフォームないものかな、と。
GoogleColabもなかなか良い線行っているのだが、自分が妄想しているのは、もっとエクセルライクなインタフェース。
データは常にスプレッドシートに表示されていて、直接編集もできる。
可視化も、アイコンをクリックしていけばグラフが出てくる。
データフレームの操作も然り、右ボタンメニューやアイコンで行える。
スクリプトも自由に書ける。
まさしく「ビジュアルPython」
こんなアプリケーションがあったら良いんだけど!
可能性があるとしたらGoogleColabの拡張みたいな形式で、Google Spreadsheetと自動連携ということになるようなものが有望なのだろうか?
もちろんスタンドアロンではなく、Jupyterみたいにブラウザベースでも良い。
Google ColabでDFをdisplayすると良い感じのインタラクティブ表示になってくれるんですが、あれが常時別タブなどで表示されているイメージですな。
Googleがやらなければ、どこかのベンチャーが手がけてくれないだろうか?と他力本願ですが100万ドルほどの資金があれば形に出来る企業やチームいるんじゃないでしょうか?
自分だって1億4千万ほど調達できれば考えますよ。
まあ自分だったらWEBベースでの開発になると思う。
データフレームの編集と可視化が出来れば最初は良いので、100万ドルとは言わず10万ドルでもいけるかも知れない(プロトとしては)。
実行環境をどうするかとか技術的な課題はあるが、これが普及すると爆発的に機械学習の技術者の裾野が拡がると思う。
正直機械学習の要であるEDA段階での作業はCUIでないといけない理由はあまりない。きめ細かな手作業が主で、使い勝手の良いツールがあればそれで良い。
科学者や研究者もエクセル的なツールを愛用しているように、データサイエンティストもコマンドや引数やデータ型から少しは解放されても良いと思う。
思うに、オフィスが一世を風靡したのはインタフェースの良さだったのではないだろうか?
途中でリボンの頃から若干複雑な作りになってしまったが、依然として優秀な部類だと思っている。
ちょっと習えば誰でも使えるようになるし、その人の目的や熟度に応じて深くダイブしていくことが出来る所がすごく良い。
機械学習もしかりで、今後はサイエンティストとまでは行かなくても、業務上ちょっとした解析や予測をしなければいけない職種も増えてくるはず。
その時に足枷になるのが、やはりコマンド地獄ということになる。
実際「大したこと」をしているわけでもないのに、ライブラリ・関数名・引数・戻り値の型まで正確に理解していないとうまく動いてくれず、本質に入るまでくたびれてしまう。
GUIがあれば、その部分をアシストしてもらえて、なおかつ本質を見失ってしまうこともないのではないか?
ちょうどgitとsource treeの関係にも近いのかも知れない。だが、これはsource treeよりもしっくりと馴染む良いツールになりそうな気がしている。
さて、どなたかこの妄想を実現してくれませんかのう??
コメント