
DeepSeek、新特許技術でデータ収集の効率化とネットワーク負荷の軽減を実現
AIスタートアップのDeepSeekが、ウェブデータ収集時のネットワーク資源消費を削減する新技術の特許を取得。大規模言語モデルの訓練データ収集に革新をもたらす。
中国のAIスタートアップ、DeepSeek(深度求索)は、ウェブデータ収集時のネットワーク資源消費を削減する新技術の特許を取得した。この特許は、ウェブクローリングにおける効率的なデータ取得方法とシステムに関するもので、2025年4月1日に中国国家知識産権局によって公開された。
この技術は、以下のような特徴を持っている:
- 可能な限り多くのウェブリンクを発見しつつ、対象ウェブサイトへのアクセス負荷を軽減。
- 既に取得したコンテンツを分析し、未取得のリンクの品質を推定。
- 高品質なデータの優先取得により、低品質や重複データのダウンロードを回避。
- データベースの安定性と整合性を保つため、独立した情報キューを採用。
この技術は、特に大規模言語モデル(LLM)の訓練データ収集において、効率的かつ高品質なデータ取得を可能にし、ネットワーク資源の最適化に寄与する。
また、DeepSeekは最近、緬甸で発生した地震の国際救援活動において、同社の技術を活用した中緬英の三言語翻訳システムを緊急開発し、実際の救援活動で使用された。
このように、DeepSeekの新技術は、AIモデルの訓練データ収集だけでなく、実際の災害救援活動にも応用されており、今後のAI技術の発展において重要な役割を果たすことが期待される。
ソース:TechNews(科技新報)
*上記掲載内容は、ジャパン・テクノロジー・グループ(JTG)がニュースの要点を、独自に整理、要約、および翻訳(海外から発信されたニュースの場合)した上で提供しているものです。