Сколько стоит твой запрос к ИИ? Изучил стоимость ввода и вывода данных у наиболее популярных ИИ — 04.10.25 17:20
Сегодня посмотрел видео на ютуб, в котором весьма интересное мнение о том, что на рынке ИИ якобы сложился пузырь, который лопнет
Так лопнет или нет?
1. На самом деле стоимость запросов очень сильно снизилась за последние 1-1.5 года.
2. Огромный вклад в это сделали китайские модели, после чего началось существенное снижение и для американских моделей
3. Подумал, что будет интересно сделать сводку по стоимости популярных моделей, а также взять некоторые старые модели — это поможет понять, а что изменилось-то?
Какие наблюдения я сделал❔
Падение цен на GPT
— GPT-4 (тот, что был в 2023 году) стоил $30 / $60 за ввод / вывод 1 млн токенов
— Сейчас GPT-5 стоит $1,25 / $10. Причем, это думающая модель!
— Недумающий GPT 5-mini стоит $0,25 / $2, который можно условно сравнить c GPT-4
— Итого, падение цены в 30 раз на вывод и в 120 раз на ввод…
— o1-pro $150 / $600 (ввод, вывод), в тоже время o3-pro $20 / $80. Тоже неслабая оптимизация случилась …
Илон Маск подвел … (шутка, все норм)
— Просто цена на Grok 3 и Grok 4 вообще не изменилась $3 / $15. Зато очень выросло качество при одинаковых затратах.
— Зато, есть Grok Code Fast, который стоит копейки $0,20 / $1,50
DeepSeek, Qwen
— Deepseek R1 $0,40 / $2 — недорого, при этом высокое качество. Достойный результат в плане затрат энергии и денег
— Qwen3 Max $1,20 / $6. Для думающей модели очень хорошо, чуть лучше, чем у GPT, качество будет сопоставимое
А что у Google?
— А вот тут интересно 🙂 … Цена на Gemini 2.5 Pro выросла в 2 раза в сравнении с Gemini 1.5 (было $1,25 / $5, стало $1,25 / $10)
— Но при этом будем честными, Gemini 1.5 крутой особо никто не считал, зато Gemini 2.5 Pro — топовая модель, которая бьет все остальные модели, поэтому это все равно крутой результат
— Gemini 2.5 Flash стоит копейки $0,10 / $0,40. Как-то тут все остальные уже прикуривают по цене …
▶️ Подготовил таблицу с ценой на нейросети, поглядеть можно тут
Давайте посчитаем стоимость 1 запроса, например, для Gemini 2.5 Flash 🔽
1. Средний вывод данных при обычном запросе — это 1.5-2к токенов
2. 2000 / 1000000 * 0,40 $= 0,0008$ = 6,8 копеек (если в рублях)
3. хахаха … ↔️
Выводы
1. Получается, проблему переоценили? Цена на запрос так и так будет падать и дальше, а энергии потребуется все меньше
2. Безусловно, поисковый запрос дешевле, но и их эффективность несопоставима …
👍 — Если по приколу было посчитать, сколько забрал денег у ИИ 🙂
📌 Я буду ОЧЕНЬ благодарен, если вы оцените пост и посмотрите мой канал в ТГ (ссылка в профиле пикабу). Всем позитива и хорошего настроения, будьте добрее друг к другу!