LLM

LLM（大規模言語モデル）の評価手法を徹底解説！人間による評価から自動評価・主要ベンチマークまで

LLM（大規模言語モデル）の性能を正しく測定するための「人間による評価」と「自動評価」の手法を分かりやすく解説。MMLUやGLUEなどの主要ベンチマーク、BLEU/ROUGE/BERTScoreなどの評価指標、実行効率、安全性評価（モデレーションAPI）まで網羅。

【2026年最新】Claude Code / GitHub Copilot / Cursor 徹底比較！利用可能なLLMと選び方ガイド

話題の「Claude Code」から定番の「GitHub Copilot」「Cursor」まで、AIコーディングツール3種を徹底比較。メリット・デメリット、利用可能な最新LLM（Claude 3.7 / GPT-4o等）や公式リンクを網羅。

【決定版】Ollamaの導入ガイド：インストールから基本操作、モデルの停止方法まで徹底解説

ローカル環境でLLMを動かせる「Ollama」の導入手順を分かりやすく解説。Windows/Mac/Linuxへのインストールから、モデルの起動・停止、便利なコマンド一覧まで。