ログインして、InfoQのすべての体験をアンロックしましょう!お気に入りの著者やトピックの最新情報を入手し、コンテンツと交流し、限定リソースをダウンロードできます。 クラウドコンピューティングの登場以降、ソフトウェア業界は大きな変革の中に ...
中国のAIスタートアップDeepSeekは1月20日、オープンソースの推論型大規模言語モデル(LLM)「DeepSeek-R1」をリリースした。同モデルは、同社が2024年末にリリースした「DeepSeek V3」を基盤としており、OpenAIの推論型LLM「o1」に匹敵する性能を数学、コーディング ...
中国のAI企業DeepSeekは1月20日(日本時間)までに、米OpenAIの「o1」と同レベルの性能をうたう大規模言語モデル(LLM)「DeepSeek-R1」を公開した。いずれもMITライセンスで、商業利用なども認めている。 モデルの性能比較(Hugging Faceから引用) 大規模な強化学習 ...
ほとんどのAIベンチマークはAIの出力精度(スキル)を測定するものですが、スキルはAIの知能を表すものではありません。スキルではなくAIの知能を測定するため、AIがスキルを効率的に習得する能力を測定するベンチマークが「ARC-AGI」です。そんなARC-AGIの ...
米Microsoftは1月29日(現地時間)、中国のAIスタートアップ DeepSeek社が公開したLLM「DeepSeek-R1」を、自社製品の「Azure AI Foundry」プラットフォームおよび「GitHub」で提供開始すると発表した。1,800を超えるモデルを有するAI開発プラットフォーム「Azure AI Foundry」の ...
インドのテクノロジー・エコシステムには、率直な検討に値する、繰り返される構造的パターンがある。製品はナショナリズム的な枠付けと政治的な後押しとともにローンチされ、メディア報道が物語を増幅し、初期採用が急増する。やがて品質とスケールのギャップが明らかに ...
DeepSeek-R1の予備段階のモデルとして 「DeepSeek-R1-Zero」 があり、これは教師ありファインチューニング (SFT) に頼らず、ベースモデルに大規模な強化学習 (RL) を直接適用することにより、複雑な問題を解決するための思考の連鎖 (CoT) を探索できるように ...
中国のAI企業であるDeepSeekが、第1世代の推論モデルである「DeepSeek-R1-Zero」と「DeepSeek-R1」をMITライセンスの下でオープン ...
サイバーエージェントは2025年1月27日、1月20日に中国のAI企業DeepSeekが公開した推論型LLM 「DeepSeek-R1」 の蒸留モデルに日本語データによる追加学習を行ったLLM 「DeepSeek-R1-Distill-Qwen-14B/ 32B-Japanese」 を公開した。 【モデル公開のお知らせ】 DeepSeek-R1-Distill-Qwen-14B ...
Cerebras Systems は本日(訳註:原文掲載日は1月30日)、DeepSeek の画期的な R1人工知能モデルを米国のサーバーでホストすると発表し、GPU 基盤のソリューションよりも最大57倍高速な速度を実現しながら、機密データを米国内に保持することを約束した。この ...
先週、中国発のAI「DeepSeek-R1」の話をしたところ、マイクロソフトから「DeepSeek-R1」の小型蒸留モデルをNPU(Neural Processing Unit)で動かせるようにしたという話が飛び込んできた。 「マイクロソフトはOpenAIと組んでるんじゃないの?」とか「DeepSeekは問題だらけ ...
「私はOpenAIのAIアシスタント」――中国AIスタートアップ・DeepSeek社の大規模言語モデル(LLM)「DeepSeek-R1」がチャットでこんな返答をするとX上で物議を醸している。DeepSeek社は米OpenAIのデータを不正に利用し、DeepSeekを開発した可能性があると、米Bloombergが1 ...