Cursor Enterpriseで2プロンプトに10ドル消費、先月はclaude-opus-4.7で1週間80ドル(ローンチ時の50%オフ込み)。LocalLLaMA板に投稿された一人のエンジニアの体験談が議論を呼んでいる。クラウドLLMの価格高騰が続いた場合、オープンソースモデルへの移行は本当に現実的な選択肢になるのか。投稿本文とコメント欄の論点を中立に整理する。
議論の出発点
発端は r/LocalLLaMA に投稿された短い体験談だ。投稿者はCursor EnterpriseでGPTおよびClaudeを使った際の課金額を共有している。
Today I burned 10$ with 2 prompts, one on gpt-5.5 and one on claude-opus-4.6-thinking. Last month I burned 80$ in one week with claude-opus-4.7 even with the 50% off they had with the launch.
つまり「2プロンプトで10ドル」「ローンチ時の50%オフを使ってもなお1週間で80ドル」という体感だ。投稿者はこの料金水準が継続するなら、5〜10倍安いオープンソースモデルへの移行が必然になると述べ、その時期について次のように予測している。
I am talking by the end of this year.
具体的なベンチ比較や移行のロードマップは投稿本文には示されていない。あくまで個人の課金体験と予測として読む必要がある。
論点の整理
コメント欄では複数の立場が交錯している。
- 価格はさらに上昇するという見方: 「価格は最低でも10倍に上がる」「補助金付きトークンの時代は終わりつつある。VCの資金が尽きかけている」というコメントが上位に並ぶ。
- ローカル推論で十分という実例: 別のユーザーは VS Code に Continue プラグイン経由で LM Studio を接続し、Qwen 3.6 を 7900XTX 上で動かした構成を共有。「60,000トークンを 110 tokens/sec で処理でき、クラウドモデルより速い」と報告している。同コメントは「大型モデルの方が良いのは確かだが差は漸進的で、失敗モードも同じ」と付け加えている。
- 反論:オープンソース化が止まる可能性: 「将来オープンソース化を止めない限りは」という短い留保コメントもあった。
- NDAと業務利用の壁: 別ユーザーは Cursor をローカルモデルへ完全に接続してオフラインで使えるようにすべきと主張。NDAの関係でクライアントコードをアップロードできないが、Cursor内には外部に接続する不透明な機能が残っており、ローカル接続も容易ではないと指摘する。同氏は RooCode と Zed Editor も試したが、それぞれ安定性とVSCode互換性に課題を感じたと述べている。
- 中間解:Cursor Composer 2: 「Auto経由で使えるfine-tuned版 Kimi K2.5(Composer 2) でかなりやれる。多少賢さは劣るが、平均的な利用者にはサステナブルな価格」というコメントもあった。
読者にとっての示唆
このスレッドから日本のエンジニア・フリーランスが受け取れる含意は限定的だが、以下の3点は元記事から直接導ける。
- クラウドLLMの月額コストはサブスクではなく従量で跳ねる局面がある。Enterpriseプランでも「2プロンプトで10ドル」が起こり得ることは、個人課金でも頭に置くべき事実だ。
- ローカル推論は性能次第で「十分速い」と感じる利用者が出始めている。ただし元記事で言及されている構成は7900XTX + Qwen 3.6 という特定のケースであり、すべての環境に一般化はできない。
- Cursor自身が中間解(Composer 2)を提供している点は見落とせない。「フロンティアモデルかローカルか」の二者択一ではなく、ベンダー側のチューニング済みモデルを Auto に任せる第3の道が既に存在する。
まとめ
- Cursor Enterprise利用者の体験談として「2プロンプト10ドル」「週80ドル」という課金が報告された。
- コメント欄ではOSSモデル移行を支持する声と、オープンソース化継続への懸念・NDA問題が並存している。
- 「年内にOSS移行が現実的になる」という予測は投稿者個人の見解であり、元記事に裏付けデータは示されていない。
実装家視点で一言。「クラウドが高いからローカル」という単純な二項対立ではなく、案件ごとにNDA・速度・賢さ・運用コストを並べて選ぶ時代に入った、という温度感のスレッドだと読んだ。Composer 2 のようなベンダー側の安価枠も無視せず、フロンティア・中間・ローカルの3レイヤーで使い分けるのが現場として一番ストレスが少ないはずだ。


コメント