【ディープラーニング×ビジネス】#7 国立国会図書館のNDLOCRを支えた技術

ディープラーニング 活用事例紹介 #7[株式会社モルフォAIソリューションズ]

事業領域は「デジタルアーカイブ事業」と「スマートシティ事業」

 2021年4月1日、国立国会図書館は今後5年間の方針を定めた「ビジョン 2021-2025 国立国会図書館のデジタルシフト」を策定した。将来にわたるすべての利用者に多様な情報資源を提供する「ユニバーサルアクセスの実現」のための事業と、そのための恒久的なインフラとなる「国のデジタル情報基盤の拡充」を図る事業が軸となる。

 その一環として、国立国会図書館は2022年4月25日、NDLOCRをオープンソースとして公開した。NDLOCRとは、既存のOCRでは不可能だった、旧字仮名遣いや異体字といった文字の読み取りを可能とする日本語OCRプログラムだ。国立国会図書館はこれを活用し、今後デジタルデータ化を進める書籍や雑誌のテキスト化に取り組む。

 このNDLOCRを開発したのが、株式会社モルフォAIソリューションズだ。NDLOCRをはじめとする「デジタルアーカイブ事業」に加え、画像認識技術を活用した「スマートシティ事業」にも取り組んでいる。同社が展開する事業やディープラーニングの活用事例について、同社代表取締役社長 兼 CEO 神田 武(かんだ たけし)氏、技術管掌執行役員 栗原 洸太(くりはら こうた)氏に話を聞いた。

写真左:株式会社モルフォAIソリューションズ 代表取締役社長兼CEO 神田 武氏、写真左:同社 技術管掌執行役員 栗原 洸太氏

株式会社モルフォAIソリューションズ
事業内容:AIコンサルティング、システムインテグレーション、SW・HW販売など
本社所在地:東京都千代田区
設立:2019年12月
https://www.morphoai.com/

――株式会社モルフォAIソリューションズの事業概要と創業の経緯を教えてください。

神田

 モルフォAIソリューションズは2019年12月に設立された会社です。グループ会社であるモルフォで培ったAI技術のさらなる事業化を目的として立ち上がりました。モルフォではスマートフォンベンダーや車載機器メーカーなどの顧客を持っており、すでに専門の営業・開発体制もありました。ただ、それ以外の業界向けの体制は手薄だったので、モルフォAIソリューションズではゼロから体制を立ち上げました。

 事業領域は「デジタルアーカイブ事業」「スマートシティ事業」の2領域です。もともとモルフォで強みのあった画像認識技術を活用可能なセキュリティカメラ向けAIを提供するスマートシティ領域はもちろん、デジタルアーカイブ領域にも可能性を感じていました。

 デジタルアーカイブとは、歴史的な資料や芸術品をデジタル化・テキスト化して再利用する取り組みを指します。テキスト化にはOCRが必要となってきますが、現在のOCRのユースケースは主に帳票上の手書き文字認識の読み取りであり、書籍や雑誌の特有のレイアウトや、明治期~昭和初期の近代書籍・雑誌に出てくる現代では使われない文字種に対応できないのです。こうした市場からのニーズや、SIerなどのパートナーとの関係構築の要素、当社の強みを鑑み、主要事業をこの2領域に定めました。