大規模な日本語インストラクションデータの開発を目指す
株式会社マネーフォワードの研究組織「Money Forward lab」は、国立研究開発法人理化学研究所と日本語の大規模言語モデル(Large Language Model、以下LLM)に関する共同研究を開始します。国立研究開発法人理化学研究所 革新知能統合研究センター 言語情報アクセス技術チームと連携し、2024年3月末までに、LLMを日本語でも高い精度で利用するためのインストラクションデータの開発を目指します。
■本研究の狙いと背景
LLMは、膨大な量のテキストデータと深層学習の技術を用いて人間のような自然な文章を生成できる言語モデルですが、特定の言語や分野に特化して高い精度の出力結果を得るためには、ファインチューニング等の技術を用いてLLMを再度学習させることが必要です。LLMの再学習には、特定のタスクを解くように学習させるファインチューニングや、多様なタスクとそれに対する出力の指示(インストラクション)のデータセットを学習させることで汎用的なタスクに対応できるようにする、インストラクションチューニングといった手法が存在します。本研究では、日本語による幅広いタスクに対応できるLLMの実現を目指して、インストラクションチューニングに活用できる質の高い日本語インストラクションデータを開発することに注力します。
また、当社の事業の1つであるバックオフィス向けSaaS事業において活用可能なLLMを実現するためには、日本国内の経理財務や人事労務領域に特化したインストラクションデータが必要となります。本研究を通して、企業のバックオフィス領域で活用な可能なインストラクションデータの構築ノウハウを蓄積し、データの開発にも取り組みます。
Money Forward Labは、これまでの研究開発で得たLLMのチューニングノウハウを活かし、本研究で開発されたデータの評価・分析する役割を担います。本研究を通して獲得したノウハウやデータは、今後、会計やカスタマーサポートなど、当社サービスやバックオフィスでの活用を検討していきます。当社は今後も、テクノロジーとデータの力を活用し、さまざまなお金に対する不安や課題を解決する取り組みを進めてまいります。
なお、本研究に関する詳細は以下をご参照ください。
・国立研究開発法人理化学研究所 革新知能統合研究センター 言語情報アクセス技術チーム
・「LLMのための日本語インストラクションデータ作成プロジェクト」ホームページ
■Money Forward Labについて
Money Forward Labは、「お金のメカニズムを解き明かすことで、人生に笑顔と驚きを。」をミッションとして、テクノロジーとデータを駆使し、家計・資産・会計の少し先の未来を可視化することで、すべてのユーザーのお金に対する漠然とした不安や課題を解決することを目指す社内研究開発組織です。思い描いた経営を安心・安全・快適に実行できる環境「Autonomous BackOffice(オートノマス・バックオフィス:バックオフィスの自律化)」をテーマに掲げ、「自律化・ユーザビリティ」の領域で研究開発を進めています。
<主な研究内容>
・大規模言語モデルのプロダクト最適化
・信用リスク分析
・金融行動分析
■理化学研究所について
名称 :国立研究開発法人理化学研究所
所在地 :埼玉県和光市広沢2-1
代表者 :理事長 五神 真
設立 :1917年(大正6年)
事業内容:日本で唯一の自然科学の総合研究所として、物理学、工学、化学、数理・情報科学、計算科学、生物学、医科学などに及ぶ広い分野で研究を進めている。
URL :https://www.riken.jp/
■株式会社マネーフォワードについて
名称 :株式会社マネーフォワード
所在地 :東京都港区芝浦 3-1-21 msb Tamachi 田町ステーションタワーS 21F
代表者 :代表取締役社長CEO 辻庸介
設立 :2012年5月
事業内容:PFMサービスおよびクラウドサービスの開発・提供
URL :https://corp.moneyforward.com/
主要サービス:
お金の見える化サービス『マネーフォワード ME』 https://moneyforward.com/
バックオフィスSaaS『マネーフォワード クラウド』 https://biz.moneyforward.com/
*記載されている会社名および商品・製品・サービス名(ロゴマーク等を含む)は、各社の商標または各権利者の登録商標です。
<本件に関するお問い合わせ先>
株式会社マネーフォワード 広報担当:相澤
E-mail:pr@moneyforward.co.jp