導入事例
社内PoC
ニュースから掲載企業情報の抽出と自動収集DB
課題
過去から蓄積されたニュースドキュメントを持っており、これをデータソースとして掲載された企業の情報と外部データを結合して企業データベースの自動化を行いたい。
ソリューション
自然言語処理技術のNER(固有表現抽出)を用いて記事テキストから企業団体名の自動抽出。
抽出した企業団体名は経済産業省が公開するオープンデータサービスgbizへの抽出検索クエリとします。
記事データをもとに大規模な最新の企業データ収集機構を実現。
自然言語処理
オープンデータ