Loose-Info.com
Last Update 2026/05/09
TOP - 各種テスト - LLM - ローカルLLMの実測値比較 Nemotron 3 Nano Omni

低スペック寄りのPCでローカルLLMを動作させた際の記録です。
LLM以外の仮想マシンなどが起動され、多少負荷がかかった状態で実行しています。
ベンチマークなどでLLMの性能を評価する内容ではありません。

検証用PC

OS

Debian GNU/Linux 12 (bookworm)

CPU

Intel(R) Core(TM) i5-14400F

GPU

GeForce RTX 3060 12GB

メモリ

DDR4 PC4-25600 32GB × 4

SSD

crucial P310 CT1000P310SSD8-JP


構築環境 : Docker + Ollama (特別な設定などは無い状態)

検証用プロンプト[英語]

Could you please recommend some great places in the US to see beautiful scenery? Around 10 places in all four directions.

検証用プロンプト[日本語]

おすすめの日本の絶景を教えてください。東西南北、10箇所程度、日本語で。

Nemotron 3 Nano Omni [実測結果一覧へ]

GPU無し[英語]
33b-q4_K_M(14.2TPS)  
GPU無し[日本語]
33b-q4_K_M(14.1TPS)  
GPU使用[英語]
33b-q4_K_M(19.2TPS)  
GPU使用[日本語]
33b-q4_K_M(19.1TPS)  

・TPS(tokens/s) は eval_count / eval_duration により算出
・モデルロード済みの検証は省略

33b-q4_K_M(GPU無し)[英語]

Model architecture nemotron_h_omni parameters 33.0B context length 131072 embedding length 2688 quantization Q4_K_M 2026-05-05 total_duration(合計時間) : 111898326659 (111.898s) load_duration(モデルのロード時間) : 11373653194 ( 11.374s) prompt_eval_count(評価されたプロンプトのトークン数) : 42 prompt_eval_duration(プロンプトの評価時間) : 907281526 ( 0.907s) eval_count(生成トークン数) : 1406 eval_duration(生成時間) : 99151474343 ( 99.151s) real 1m51.918s user 0m0.030s sys 0m0.023s メモリ使用量(RSS) : 28487200 KB

33b-q4_K_M(GPU無し)[日本語]

Model architecture nemotron_h_omni parameters 33.0B context length 131072 embedding length 2688 quantization Q4_K_M 2026-05-05 total_duration(合計時間) : 78382347591 (78.382s) load_duration(モデルのロード時間) : 4363406224 ( 4.363s) prompt_eval_count(評価されたプロンプトのトークン数) : 47 prompt_eval_duration(プロンプトの評価時間) : 979318745 ( 0.979s) eval_count(生成トークン数) : 1025 eval_duration(生成時間) : 72684068860 (72.684s) real 1m18.402s user 0m0.056s sys 0m0.007s メモリ使用量(RSS) : 28508424 KB ------------------------------------------------- 【生成結果に関する検証】 ・紹介ポイントは10箇所。東西南北を考慮 ・言語混同無し ・地名・解説に間違いが非常に多い 例:「稚内灯台から望む大雪山の雪化粧」「尾張津島(愛知県)の津島神社と境港の潮風」 ・文章は違和感を感じないレベル(内容の評価を除く) -------------------------------------------------

33b-q4_K_M(GPU使用)[英語]

Model architecture nemotron_h_omni parameters 33.0B context length 131072 embedding length 2688 quantization Q4_K_M 2026-05-05 total_duration(合計時間) : 131304373969 (131.304s) load_duration(モデルのロード時間) : 5141026034 ( 5.141s) prompt_eval_count(評価されたプロンプトのトークン数) : 42 prompt_eval_duration(プロンプトの評価時間) : 847021969 ( 0.847s) eval_count(生成トークン数) : 2388 eval_duration(生成時間) : 124613445998 (124.613s) real 2m11.317s user 0m0.033s sys 0m0.015s +---------------------------------------------------------------------------------------+ | NVIDIA-SMI 535.261.03 Driver Version: 535.261.03 CUDA Version: 12.2 | |-----------------------------------------+----------------------+----------------------+ | GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |=========================================+======================+======================| | 0 NVIDIA GeForce RTX 3060 On | 00000000:01:00.0 On | N/A | | 0% 50C P2 53W / 170W | 11298MiB / 12288MiB | 7% Default | | | | N/A | +-----------------------------------------+----------------------+----------------------+ +---------------------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=======================================================================================| | 0 N/A N/A 1097 G /usr/lib/xorg/Xorg 113MiB | | 0 N/A N/A 1871 G xfwm4 2MiB | | 0 N/A N/A 2384 G /usr/bin/x-www-browser 145MiB | | 0 N/A N/A 35991 C /usr/bin/ollama 11024MiB | +---------------------------------------------------------------------------------------+ メモリ使用量(RSS) : 19750908 KB

33b-q4_K_M(GPU使用)[日本語]

Model architecture nemotron_h_omni parameters 33.0B context length 131072 embedding length 2688 quantization Q4_K_M 2026-05-05 total_duration(合計時間) : 109755424871 (109.755s) load_duration(モデルのロード時間) : 4860097666 ( 4.860s) prompt_eval_count(評価されたプロンプトのトークン数) : 47 prompt_eval_duration(プロンプトの評価時間) : 813078653 ( 0.813s) eval_count(生成トークン数) : 1973 eval_duration(生成時間) : 103495221095 (103.495s) real 1m49.767s user 0m0.031s sys 0m0.012s +---------------------------------------------------------------------------------------+ | NVIDIA-SMI 535.261.03 Driver Version: 535.261.03 CUDA Version: 12.2 | |-----------------------------------------+----------------------+----------------------+ | GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |=========================================+======================+======================| | 0 NVIDIA GeForce RTX 3060 On | 00000000:01:00.0 On | N/A | | 0% 55C P2 53W / 170W | 11298MiB / 12288MiB | 8% Default | | | | N/A | +-----------------------------------------+----------------------+----------------------+ +---------------------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=======================================================================================| | 0 N/A N/A 1097 G /usr/lib/xorg/Xorg 113MiB | | 0 N/A N/A 1871 G xfwm4 2MiB | | 0 N/A N/A 2384 G /usr/bin/x-www-browser 145MiB | | 0 N/A N/A 60130 C /usr/bin/ollama 11024MiB | +---------------------------------------------------------------------------------------+ メモリ使用量(RSS) : 19732140 KB ------------------------------------------------- 【生成結果に関する検証】 ・紹介ポイントは10箇所。東西南北を考慮 ・言語混同が発生 「 orange‑red のコントラスト」「奄美大島・知名 Beach」 ・地域・名称間違いが発生 「長崎・デジタル海岸」「箱根湖と周囲の山々が」 ・文章は違和感を感じないレベル(内容の評価を除く) -------------------------------------------------