LLM

OLMo Hybrid登場 — RNN×Transformer融合が切り拓くLLMアーキテクチャの未来

AI2(Allen Institute for AI)が公開したOLMo Hybridは、従来のTransformerアーキテクチャにRNN(再帰型ニューラルネットワーク)モジュールを組み合わせた新しいハイブリッド型言語モデルだ。Gated DeltaNet(GDN)と呼ばれるRNN手法を採用し、訓練効率を従来比...
未分類

デジタル庁が「ガバメントAI」用の国産LLMを7件選定 ― tsuzumi 2やPLaMo 2.0など、2027年度の政府調達開始へ

デジタル庁は2026年3月6日、政府向けAI環境「源内(げんない)」で試用する国内開発の大規模言語モデル(LLM)を7件選定したと発表した。NTTデータの「tsuzumi 2」やPreferred Networksの「PLaMo 2.0 Prime」など、国内の主要AIベンダーが名を連ねており、2027年度からの...
お知らせ

永続メモリがLLMの思考を変える:同じモデル・同じプロンプトでも「記憶の足場」で出力が激変する研究

Claude Opus 4.6を使った実験で、永続的なメモリ(Memory Scaffolding)がLLMの推論を根本的に変えることが実証されました。同じモデル、同じプロンプト、同じ温度設定でも、メモリの足場構造が異なるだけで、まったく異なるアーキテクチャの解決策が生まれるという衝撃的な結果です。この研究は、C...

中国LLMにとって蒸留はどれほど重要なのか? ― Anthropicの「蒸留攻撃」告発を検証する

AIの知識蒸留(ディスティレーション)を巡る議論が、業界を大きく揺るがしている。Anthropicが中国のAIラボ3社(DeepSeek、Moonshot AI、MiniMax)による大規模な「蒸留攻撃」を告発したことを受け、AI研究者のNathan Lambert氏が「蒸留は本当にそれほど重要なのか?」という核...
雑記

AI生成マルウェア「Arkanix Stealer」が登場するも短命に終わる──LLM悪用の新たな脅威パターン

2025年末、ダークウェブフォーラムに突如現れた情報窃取マルウェア「Arkanix Stealer」。AI(大規模言語モデル)を活用して開発されたとみられるこのマルウェアは、わずか数ヶ月で姿を消した。しかし、その短い活動期間の中で示された手口は、AIがサイバー犯罪の開発コストと時間を劇的に削減しうることを浮き彫り...
雑記

Microsoft、オープンウェイトLLMのバックドアを検出するスキャナーを開発

Microsoftが、オープンウェイト(公開重み)の大規模言語モデル(LLM)に潜むバックドアを検出する軽量スキャナーを開発しました。AIセキュリティの新たな課題である「モデルポイズニング」への対策として、企業や開発者がオープンソースのAIモデルを安全に利用するための重要なツールとなります。 この記事のポイント...

Bifrost:最速のオープンソースAIゲートウェイが本番環境のLLM運用を変える

LLMを本番環境で運用する際、モデル自体の性能だけでなく、複数プロバイダーの管理、レイテンシの予測困難性、障害対応、可視性の欠如といった課題に直面します。Maximが開発したオープンソースのLLMゲートウェイ「Bifrost」は、これらの課題を解決するために設計された高性能な基盤ツールです。 この記事のポイント...