DeepSeek、新特許技術でデータ収集の効率化とネットワーク負荷の軽減を実現

AIスタートアップのDeepSeekが、ウェブデータ収集時のネットワーク資源消費を削減する新技術の特許を取得。大規模言語モデルの訓練データ収集に革新をもたらす。


中国のAIスタートアップ、DeepSeek(深度求索)は、ウェブデータ収集時のネットワーク資源消費を削減する新技術の特許を取得した。この特許は、ウェブクローリングにおける効率的なデータ取得方法とシステムに関するもので、2025年4月1日に中国国家知識産権局によって公開された。

この技術は、以下のような特徴を持っている:

  • 可能な限り多くのウェブリンクを発見しつつ、対象ウェブサイトへのアクセス負荷を軽減。
  • 既に取得したコンテンツを分析し、未取得のリンクの品質を推定。
  • 高品質なデータの優先取得により、低品質や重複データのダウンロードを回避。
  • データベースの安定性と整合性を保つため、独立した情報キューを採用。

この技術は、特に大規模言語モデル(LLM)の訓練データ収集において、効率的かつ高品質なデータ取得を可能にし、ネットワーク資源の最適化に寄与する。

また、DeepSeekは最近、緬甸で発生した地震の国際救援活動において、同社の技術を活用した中緬英の三言語翻訳システムを緊急開発し、実際の救援活動で使用された。

このように、DeepSeekの新技術は、AIモデルの訓練データ収集だけでなく、実際の災害救援活動にも応用されており、今後のAI技術の発展において重要な役割を果たすことが期待される。


ソース:TechNews(科技新報)


*上記掲載内容は、ジャパン・テクノロジー・グループ(JTG)がニュースの要点を、独自に整理、要約、および翻訳(海外から発信されたニュースの場合)した上で提供しているものです。

News