Keep Innovating! Blog

Keep Innovating! Blog

MLSE夏合宿2024でポスター発表をしました

MLOps アカデミック knitfab
髙岡陽太

皆さんこんにちは。株式会社オープンストリーム・技術創発推進室の髙岡陽太です。連日、真夏の暑さが続いていますね。熱中症対策はバッチリですか?

さて、私は先月7月4日から7月6日にかけて開催された、日本ソフトウェア学会・機械学習工学研究会(MLSE)の夏合宿に参加し、ポスターセッションで当社のMLOps 基盤ツール Knitfab を紹介しました。

この記事では、その発表の内容を振り返ります。

MLSE夏合宿2024について

MLSE夏合宿2024は、機械学習やAIを活用・社会実装していこう、という人々が産学各方面から集まって情報交換をするという、3日にわたるバーチャル合宿となっています。事例紹介や法規制・基準策定に関する国際的な動向など、様々な知見が交換されました。

今年の内容は大規模言語モデル(LLM)に関するトピックがかなりの部分を占めていたように思います。ここ1年少々の短期間に急成長した LLM ですが、すでに多種多様な研究や取り組みが報告されています。例えば、LLM を使ったシステムの品質を保つために実務的に何ができるのか、どうすればスケールするのか、どうすれば安心・安全に使っていけるのか、といった様々な議論が活発に行われました。

参加のねらい

合宿中には「研究発表」と「ポスターセッション」という企画がありました。「研究発表」では、合宿参加者が持ち寄った研究や実践の内容を発表し、その後「ポスターセッション」でその発表内容について参加者間でディスカッションしました。

私は Knitfab をテーマとした発表をしました(ポスターは下図)。データサイエンス実務者をはじめとした様々な方に Knitfab を紹介するとともに、MLOps の取り組みについてディスカッションをしよう、というねらいをもって臨みました。

発表をふりかえって

ポスターセッションでは、実際に複数の方と Knitfab について有意義なディスカッションを交わすことができました。お付き合いいただきました皆様に感謝申し上げます。

Knitfab は自由で動的に拡張できるパイプラインを表現できるようにするために、機能の抽象度を高めたツールです。それがKnitfabの良いところだと信じていますが、一方でとっつきにくさにつながってしまっているな、という感触をディスカッションの中で得ることができました。「データが来たら、それに対して適用できる処理をぜんぶやる」という仕掛けと、これで機械学習タスクを連鎖的に遂行できる、ということの間にある理解のギャップをうまく埋めていく必要がありそうです。

また、Knitfab におけるパイプラインの表現は、初めて説明を受けた人にとってはやや驚きをもって迎えられるようでありました。というのも、他のパイプライン管理系ツールが提供する機能は通常「ひとつなぎのパイプラインを一度に作る」という形式を取っているのに対して、Knitfab では「ステップごとにタスク定義(Plan)を登録する」「Data が登録されると、それをきっかけに Plan に基づいたタスクの実行(Run)が起きる」という形式をとるので、この違いが驚きにつながるようです。ディスカッションを通じて、この方式の利点である「パイプラインをいつでも拡張できる」ことや、ML実験の実施が自然と網羅的になることの嬉しさをご理解いただけたようですが、専門家にとっても新奇に見えるこの機能を、多くのユーザに分かりやすく伝える工夫が必要だなと感じました。

別の論点としては、機械学習エンジニアにとって Jupyter Notebook が非常に重要な開発環境である、ということも実務者周辺の方々から聞き取って確認することができました。このあたりは Knitfab がまだ十分にサポートできていない部分です。また、Knitfabではコンテナ技術に対する一定の知識を機械学習エンジニアに求めますが、これも利用にあたってのハードルになるという認識を持ちました。このあたりも、CLI やドキュメントなどで支援していければな、と考えています。

おわりに

以上、MLSE夏合宿に参加してきました、というご報告でした。

実は私、今回が初めてのポスター発表ということでちょっと緊張していたのですが、どうにかやり遂げることができて一安心しております。

今後とも Knitfab をご紹介できる機会があれば、是非お話をしていきたいな、と考えています。その際には、是非どうぞよろしくお願いします。


著者プロフィール

名前: 高岡陽太

株式会社オープンストリーム/技術創発推進室 

長らく Web 系のシステム開発をしてきたが、2019年頃から機械学習関連の案件に携わり始めた。
ディープラーニングモデルの開発からその API 化、フロントエンド開発まで、必要とあらば一通り手掛ける。
最近は、機械学習それ自体はもとより、機械学習開発を支える技術としての MLOps に興味を持っている。

MLOps 用基盤ツール Knitfab の開発リード。

タグ
メンバー
ページトップ