LLM - DailyTechLog

OLMo Hybrid登場 — RNN×Transformer融合が切り拓くLLMアーキテクチャの未来

AI2（Allen Institute for AI）が公開したOLMo Hybridは、従来のTransformerアーキテクチャにRNN（再帰型ニューラルネットワーク）モジュールを組み合わせた新しいハイブリッド型言語モデルだ。Gated DeltaNet（GDN）と呼ばれるRNN手法を採用し、訓練効率を従来比...

2026.03.08

デジタル庁が「ガバメントAI」用の国産LLMを7件選定 ― tsuzumi 2やPLaMo 2.0など、2027年度の政府調達開始へ

デジタル庁は2026年3月6日、政府向けAI環境「源内（げんない）」で試用する国内開発の大規模言語モデル（LLM）を7件選定したと発表した。NTTデータの「tsuzumi 2」やPreferred Networksの「PLaMo 2.0 Prime」など、国内の主要AIベンダーが名を連ねており、2027年度からの...

2026.03.07

未分類

永続メモリがLLMの思考を変える：同じモデル・同じプロンプトでも「記憶の足場」で出力が激変する研究

Claude Opus 4.6を使った実験で、永続的なメモリ（Memory Scaffolding）がLLMの推論を根本的に変えることが実証されました。同じモデル、同じプロンプト、同じ温度設定でも、メモリの足場構造が異なるだけで、まったく異なるアーキテクチャの解決策が生まれるという衝撃的な結果です。この研究は、C...

2026.03.01

お知らせ

中国LLMにとって蒸留はどれほど重要なのか？ ― Anthropicの「蒸留攻撃」告発を検証する

AIの知識蒸留（ディスティレーション）を巡る議論が、業界を大きく揺るがしている。Anthropicが中国のAIラボ3社（DeepSeek、Moonshot AI、MiniMax）による大規模な「蒸留攻撃」を告発したことを受け、AI研究者のNathan Lambert氏が「蒸留は本当にそれほど重要なのか？」という核...

2026.02.25

AI生成マルウェア「Arkanix Stealer」が登場するも短命に終わる──LLM悪用の新たな脅威パターン

2025年末、ダークウェブフォーラムに突如現れた情報窃取マルウェア「Arkanix Stealer」。AI（大規模言語モデル）を活用して開発されたとみられるこのマルウェアは、わずか数ヶ月で姿を消した。しかし、その短い活動期間の中で示された手口は、AIがサイバー犯罪の開発コストと時間を劇的に削減しうることを浮き彫り...

2026.02.24

雑記

Microsoft、オープンウェイトLLMのバックドアを検出するスキャナーを開発

Microsoftが、オープンウェイト（公開重み）の大規模言語モデル（LLM）に潜むバックドアを検出する軽量スキャナーを開発しました。AIセキュリティの新たな課題である「モデルポイズニング」への対策として、企業や開発者がオープンソースのAIモデルを安全に利用するための重要なツールとなります。この記事のポイント...

2026.02.05

雑記

Bifrost：最速のオープンソースAIゲートウェイが本番環境のLLM運用を変える

LLMを本番環境で運用する際、モデル自体の性能だけでなく、複数プロバイダーの管理、レイテンシの予測困難性、障害対応、可視性の欠如といった課題に直面します。Maximが開発したオープンソースのLLMゲートウェイ「Bifrost」は、これらの課題を解決するために設計された高性能な基盤ツールです。この記事のポイント...

2026.01.26