Ollamaとは?ローカル環境でAIを動かすメリット
Ollamaは、Llama 3やMistralといった大規模言語モデル(LLM)を、個人のPC上で手軽に実行するためのオープンソースツールです。複雑な設定なしに、数コマンドで最新のAIモデルを動かせるのが最大の特徴です。
- プライバシー: データが外部サーバーに送信されないため、安全に利用できます。
- コスト: 自分のハードウェアを利用するため、API使用料がかかりません。
- オフライン対応: 一度モデルをダウンロードすれば、インターネット環境なしで動作します。
[Image: Ollamaの仕組みとローカル実行のイメージ図]
1. Ollamaのインストール手順
OSごとの公式インストーラーを使用して導入します。
Windows / macOSの場合
- Ollama公式サイトへアクセスします。
- 使用しているOSのインストーラーをダウンロードし、実行します。
- インストール完了後、メニューバー(Mac)やタスクトレイ(Windows)にOllamaのアイコンが表示されれば成功です。
Linuxの場合
ターミナルを開き、以下のコマンドを実行します。
curl -fsSL https://ollama.com/install.sh | sh
2. モデルの起動と対話(利用方法)
インストールが完了したら、実際にAIモデルをダウンロードして起動してみましょう。ここでは標準的な「Llama 3」を例に解説します。
ターミナル(またはコマンドプロンプト)を起動し、以下のコマンドを入力します。
ollama run llama3
初回実行時はモデルのダウンロードが始まります。完了すると入力待ち状態(>>>)になるので、自由に質問を投げてください。
よく使われるモデル名
| モデル名 | 特徴 | 実行コマンド |
|---|---|---|
| llama3 | Metaが開発した高性能モデル | ollama run llama3 |
| gemma | Google開発の軽量・高精度モデル | ollama run gemma |
| mistral | バランスの取れた人気モデル | ollama run mistral |
3. モデルの停止・終了方法
Ollamaの操作において、対話の終了とサービスの停止は異なります。
対話モードを終了する
チャットを終了するには、以下のいずれかを入力します。
/byeと入力してEnter- ショートカット
Ctrl + D
実行中のモデルを停止(メモリ解放)する
モデルがバックグラウンドでメモリ(VRAM)を専有している場合、以下のコマンドで明示的に停止できます。
ollama stop <モデル名>
Ollamaサービス自体を終了する
- Windows/Mac: タスクトレイまたはメニューバーのアイコンを右クリックし、「Quit Ollama」を選択します。
- Linux (systemd):
sudo systemctl stop ollama
まとめ:これだけは覚えたい基本コマンド
日常的に使うコマンドをまとめました。これらさえ把握しておけば運用に困ることはありません。
ollama list:ダウンロード済みモデルの一覧を表示ollama rm <モデル名>:モデルを削除してディスク容量を空けるollama pull <モデル名>:実行せずにダウンロードだけ行う

