Обсуждение ИИ (искусственного интеллекта). Реальность, будущее, возможные проблемы.

Железо, программы, связь, сети и тд
Сообщение
Автор
Аватара пользователя
zaratustra
Сообщения: 11381
Зарегистрирован: 19 дек 2020, 17:35
Пол: Мужской

Обсуждение ИИ (искусственного интеллекта). Реальность, будущее, возможные проблемы.

#821 Сообщение zaratustra » 21 ноя 2025, 18:36

Почему эта задача трудна для большинства ИИ-моделей?
Спойлер
Потому что она не про рассуждение, а про символьную задачу с жёсткими инвариантами и дискретной оптимизацией:

нужно правильно формализовать условия;

построить систему уравнений;

понять ограничения целочисленности;

и сделать перебор/вывод минимума.

Это не текстовая логика, а почти алгоритмическая задача.
А языковые модели — статистические предсказатели текста, а не решатели уравнений.

Чтобы решить это правильно, нужна способность к:

1) Символьной формализации (Symbolic reasoning)

— понять, что действия изменяют состояние по строгим правилам.
— увидеть инварианты: изменения количества багов и фич.

2) Построению уравнений

Модель должна увидеть математические закономерности, а не «семантически подобные» цепочки.

3) Целочисленным ограничениям

Это азы комбинаторики, но LLM почти всегда тут проваливаются.

4) Планированию и оптимизации

Нужно доказать минимум, а не просто перебрать примеры.

5) Устойчивости к ложным путям

Вот здесь большинство моделей ломается.

⭐ Каким должна быть модель, чтобы стабильно решать такие задачи?
✔ 1. Размер модели

Минимум 13B параметров, но лучше 30B–70B.

Почему:

Модели <10B почти всегда «выдумывают» формулы.

Даже 13B может решить, но очень нестабильно.

30B+ начинает уверенно формализовывать.

Пример реальных способностей:

LLaMA 8B / Qwen 7B — в 90% случаев не решают.

LLaMA 13B / Qwen 14B — иногда решат, но очень нестабильно.

LLaMA 70B / Qwen 72B — обычно решают, но могут ошибаться.

GPT-4/5, Claude Opus/3.5, Gemini Ultra — практически всегда решают.

✔ 2. Контекстная «глубина рассуждений»

Обычно называется:

Chain-of-thought capability

Long reasoning depth

Step-by-step extraction

Multi-hop reasoning

Это не параметр железа, а качества обучения:

специальные датасеты (GSM8K++, MATH, ProofWriter, OMoE reasoning datasets)

RLHF или DPO на задачах рассуждения

иногда — специализированные «reflection loops»

Без этого даже 70B модель будет давать «умный бред».

✔ 3. Специализированные архитектуры reasoning-типа

Последние модели улучшили структурную логику:

DeepSeek-R / DeepSeek-MoE

OpenAI o1-mini / o1-preview

Qwen2.5-MATH / Qwen-Reasoning

LLaMA-3.1 reasoning-tuned

Без этой специализации модель будет цепляться за текстовые паттерны вместо точной математики.

✔ 4. Возможность работать с внешним инструментом формальной проверки (как у больших моделей)

Модели уровня GPT-4/5 и Claude используют скрытую штуку:

инструментальный рассудок
(порождают промежуточные программы/уравнения, которые потом валидируются внутренними подсистемами)

Оффлайн 7B–13B такие подсистемы не имеют.
Поэтому они:

неверно «раскладывают» условия,

путают эффект операций,

нарушают инварианты,

не замечают противоречий.

⭐ Какой комплект нужен, чтобы локальная модель помогала решать такие задачи?

Если у вас 8 GB VRAM, то:

🟥 невозможно запустить модель, которая будет стабильно решать такие задачи

(слишком мало памяти для 30B–70B FP16/FP32 моделей)

🟧 возможно иногда решить, но со значительной вероятностью ошибки:

Qwen 7B

LLaMA 8B

Mixtral 8x7B (MoE — частично влезет, но медленно)

DeepSeek 7B

Mistral 7B

Вероятность правильного решения: 5–25%.

🟩 близко к стабильному решению при квантовании и большом CPU/RAM:

(но не на одной GPU 8GB)

Qwen 14B Q4_K_M (на CPU)

Mistral medium/large (32–50B) в квантованной версии

DeepSeek-R1-Distill 32B

Вероятность: 60–80%.

🟦 стабильно решают только модели 30–70B+ с reasoning-тюнингом

(но для них нужно 24–80 GB VRAM или CPU-кластер):

Например:

Qwen2.5-72B-Inst

LLaMA-3.1-70B

DeepSeek-Reasoner-MoE 671B (через MoE маршрутизацию)

Gemma 27B-IT reasoning

Вероятность: 90–99%.

⭐ Почему такие задачи — «лакмусовая бумажка» качества ИИ?

Потому что они требуют:

строгой формальной логики

понимания дискретных операций

построения систем уравнений

проверки решений

поиска минимума

устойчивости к логическим ловушкам

Это нечто среднее между:

олимпиадной математикой,

моделированием состояний,

арифметикой первого порядка.

Маленькие модели не хранят в параметрах такие паттерны, потому что они редкие и плохо коррелируют с текстовыми корпусами.
При взгляде на ближнего шалости приходят в голову сами по себе.

Commercial

Флудилка№ 8 Да будет ветер Светлых перемен :)

Что бы не видеть рекламу после первого сообщения - необходимо зарегистрироваться и войти на форум.


Аватара пользователя
Добрый Фей
Сообщения: 1490
Зарегистрирован: 23 апр 2019, 14:52
Пол: Мужской

Обсуждение ИИ (искусственного интеллекта). Реальность, будущее, возможные проблемы.

#823 Сообщение Добрый Фей » 21 ноя 2025, 23:24

zaratustra писал(а): 21 ноя 2025, 18:36 Почему эта задача трудна для большинства ИИ-моделей?
Потому что изначально условия звучат не логично, выполняя фичу только время ее выполнения определяет какой будет результат, это и ставит в тупик ИИ
Ругаешь страну, хотя ещё так молод.
В твоих руках айфон и кофе,
А не серп и молот.

Чемберлен 1
Сообщения: 11283
Зарегистрирован: 09 фев 2020, 19:24
Предупреждения: 1
Пол: Мужской

Обсуждение ИИ (искусственного интеллекта). Реальность, будущее, возможные проблемы.

#824 Сообщение Чемберлен » 22 ноя 2025, 10:21

Иван Н писал(а): 21 ноя 2025, 20:24 Это всё Чемберлен советуется десять раз в день с ДипСиком по ТКМ, вот поэтому и показатели такие высокие.
Пожалуй, так :)
Список файлов, в которых сохранены все беседы с ДС.
В основном ТКМ, диетология, огородничество.
Там много мне незнакомой информации и объем большой.
Что-то сейчас востребовано, что-то может быть.
Храню по датам.
Локально индексирую и использую поиск с помощью программы Archivarius.
С ее помощью индексирую все что нужно, на всех дисках.
Удобно.
Вот список фалов по датам
Спойлер
DeepSeek-2025-06-13.docx
DeepSeek-2025-06-25.docx
DeepSeek-2025-07-03.docx
DeepSeek-2025-07-16.docx
DeepSeek-2025-07-16-1.docx
DeepSeek-2025-07-20.docx
DeepSeek-2025-07-22.docx
DeepSeek-2025-07-28.docx
DeepSeek-2025-07-30.docx
DeepSeek-2025-08-02.docx
DeepSeek-2025-08-04.docx
DeepSeek-2025-08-06.docx
DeepSeek-2025-08-09.docx
DeepSeek-2025-08-16.docx
DeepSeek-2025-08-19.docx
DeepSeek-2025-08-20.docx
DeepSeek-2025-08-27.docx
DeepSeek-2025-08-31.docx
DeepSeek-2025-09-04.docx
DeepSeek-2025-09-16.docx
DeepSeek-2025-09-17.docx
DeepSeek-2025-09-18.docx
DeepSeek-2025-09-21-1.docx
DeepSeek-2025-09-21-2.docx
DeepSeek-2025-09-21-3.docx
DeepSeek-2025-09-21-4.docx
DeepSeek-2025-09-21-5.docx
DeepSeek-2025-09-21-6.docx
DeepSeek-2025-09-21-7.docx
DeepSeek-2025-09-21-8.docx
DeepSeek-2025-09-21-9.docx
DeepSeek-2025-09-21-91.docx
DeepSeek-2025-09-25.docx
DeepSeek-2025-09-26.docx
DeepSeek-2025-09-26-3.docx
DeepSeek-2025-09-27.docx
DeepSeek-2025-09-28.docx
DeepSeek-2025-09-29.docx
DeepSeek-2025-09-30.docx
DeepSeek-2025-09-30-2.docx
DeepSeek-2025-10-01.docx
DeepSeek-2025-10-03.docx
DeepSeek-2025-10-03-1.docx
DeepSeek-2025-10-04.docx
DeepSeek-2025-10-04-1.docx
DeepSeek-2025-10-05.docx
DeepSeek-2025-10-06.docx
DeepSeek-2025-10-06-1.docx
DeepSeek-2025-10-06-2.docx
DeepSeek-2025-10-09.docx
DeepSeek-2025-10-09-1.docx
DeepSeek-2025-10-10.docx
DeepSeek-2025-10-10-1.docx
DeepSeek-2025-10-26.docx
DeepSeek-2025-10-29.docx
DeepSeek-2025-11-02.docx
DeepSeek-2025-11-02-1.docx
DeepSeek-2025-11-05.docx
DeepSeek-2025-11-06.docx
DeepSeek-2025-11-12.docx
DeepSeek-2025-11-14.docx
DeepSeek-2025-11-14-1.docx
DeepSeek-2025-11-19.docx
DeepSeek-2025-11-21.docx
DeepSeek-2025-11-21-1.docx
Ответ ДС храню хронологически внутри файла - вопрос - ответ
Практически всегда готовлю вопросы, продумываю.
Готовлю уточняющие вопросы на возможные ответы ДС, иногда по ходу.

Аватара пользователя
ManYacK
Сообщения: 25262
Зарегистрирован: 29 мар 2019, 10:19
Пол: Мужской

Обсуждение ИИ (искусственного интеллекта). Реальность, будущее, возможные проблемы.

#825 Сообщение ManYacK » 22 ноя 2025, 10:40

попросил ДипСик:
а ты можешь составить такую задачу, с которой легко справится человек, но которая очень сложна для нейросетей - и не каждая ее осилит?

его вариант:
Текст: «Холодильник плакал на кухне. Молоко убежало ещё вчера, оставив записку на дверце: "Я не вернусь. Ищи другую пару для утренних хлопьев"».
Вопрос: Какие человеческие эмоции и социальные ситуации метафорически описаны в этом тексте? Объясните, почему молоко «убежало» и что означает «искать другую пару».


ГигаЧат для проверки провел глубокий анализ эмоций вещей не поняв метафоричность ситуации.
Забавно, что сам ДипСик не мог полностью осознать всю глубину метафоры описывающей трагичность ситуации. И мне пришлось ему долго объяснять, как связано убежавшее молоко с уходом хозяйки и при чем тут растаявший холодильник :-)

в ответ ГигаЧат предложил более короткую задачу, которую провалил ДипСик.
"Петя увидел машину дяди Серёжи, и ему стало интересно, чья машина лучше."
Кто является владельцем машины в данном предложении?
Варианты ответов:
1. Петя.
2. Дядя Серёжа.
3. Невозможно однозначно определить.

Аватара пользователя
Иван Н
Спонсоры форума
Сообщения: 42900
Зарегистрирован: 17 янв 2019, 03:52
Откуда: Красноярск
Пол: Мужской

Обсуждение ИИ (искусственного интеллекта). Реальность, будущее, возможные проблемы.

#826 Сообщение Иван Н » 22 ноя 2025, 12:11

Бабло всегда побеждает зло.

Аватара пользователя
zaratustra
Сообщения: 11381
Зарегистрирован: 19 дек 2020, 17:35
Пол: Мужской

Обсуждение ИИ (искусственного интеллекта). Реальность, будущее, возможные проблемы.

#827 Сообщение zaratustra » 22 ноя 2025, 12:29

ManYacK писал(а): 22 ноя 2025, 10:40 в ответ ГигаЧат предложил более короткую задачу, которую провалил ДипСик.
"Петя увидел машину дяди Серёжи, и ему стало интересно, чья машина лучше."
У меня дипсик за 6 секунд решил.
Спойлер
Петя увидел машину дяди Серёжи, и ему стало интересно, чья машина лучше.
Кто является владельцем машины в данном предложении?
Варианты ответов:
1. Петя.
2. Дядя Серёжа.
3. Невозможно однозначно определить.
Хм, пользователь задает конкретный вопрос о принадлежности машины в предложении. Нужно внимательно разобрать структуру предложения.

Вижу конструкцию "машина дяди Серёжи" — это ключевой момент. В русском языке такие притяжательные конструкции четко указывают на владельца.

Можно рассмотреть альтернативные варианты: если бы машина принадлежала Пете, предложение было бы построено иначе. Но здесь грамматика однозначно указывает на дядю Сережу.

Дополнительные контекстные подсказки (упоминание Пети как наблюдателя) только подтверждают этот анализ. Ответ должен быть кратким и точным, без лишних рассуждений.

Правильный ответ: 2. Дядя Серёжа.

Объяснение:

В предложении прямо указано: "машина дяди Серёжи". Эта конструкция в родительном падеже однозначно указывает на принадлежность: машина (кого?) дяди Серёжи.

То, что Петя её увидел и сравнивает, не делает его владельцем. Он просто субъект наблюдения.
При взгляде на ближнего шалости приходят в голову сами по себе.

Аватара пользователя
Добрый Фей
Сообщения: 1490
Зарегистрирован: 23 апр 2019, 14:52
Пол: Мужской

Обсуждение ИИ (искусственного интеллекта). Реальность, будущее, возможные проблемы.

#828 Сообщение Добрый Фей » 22 ноя 2025, 12:44

ManYacK писал(а): 22 ноя 2025, 10:40 попросил ДипСик:
а ты можешь составить такую задачу, с которой легко справится человек, но которая очень сложна для нейросетей - и не каждая ее осилит?
Зачем изобретать велосипед? Любая детская загадка ставит ИИ в тупик... берем журнал мурзилка за прошлый век и спрашиваем "Что бы спереди погладить надо сзади полизать?" :laugh:
Ругаешь страну, хотя ещё так молод.
В твоих руках айфон и кофе,
А не серп и молот.

Аватара пользователя
ManYacK
Сообщения: 25262
Зарегистрирован: 29 мар 2019, 10:19
Пол: Мужской

Обсуждение ИИ (искусственного интеллекта). Реальность, будущее, возможные проблемы.

#829 Сообщение ManYacK » 22 ноя 2025, 13:45

zaratustra писал(а): 22 ноя 2025, 12:29 У меня дипсик за 6 секунд решил.
это не правильный ответ. Вопрос предлагает к сравнению как минимум две машины. А и тут может быть три ответа в зависимости от контекста. Правильный ответ №3

Поясню: Машина может быть и у самого Пети, или у папы Пети.

P.S. а я знал, что у нас на форуме боты маскируются под пользователей :-D

Аватара пользователя
Иван Н
Спонсоры форума
Сообщения: 42900
Зарегистрирован: 17 янв 2019, 03:52
Откуда: Красноярск
Пол: Мужской

Обсуждение ИИ (искусственного интеллекта). Реальность, будущее, возможные проблемы.

#830 Сообщение Иван Н » 22 ноя 2025, 15:34



Бабло всегда побеждает зло.

Чемберлен 1
Сообщения: 11283
Зарегистрирован: 09 фев 2020, 19:24
Предупреждения: 1
Пол: Мужской

Обсуждение ИИ (искусственного интеллекта). Реальность, будущее, возможные проблемы.

#831 Сообщение Чемберлен » 22 ноя 2025, 17:37

Что мне шибко не нравится в ИИ ДС на ПК и в мессенджерах - отправки сообщение по Enter.
Привык большие тексты делить на абзацы - нужно жать Ctrl+Enter.
Иногда много раз.
И вот на ПК в ИИ ДС у меня дважды при нажатии Ctrl+Enter пропал весь диалог с начала.
Я уже задал несколько вопросов и получил несколько длинных ответов, которые скролинговали быстро и прочитать и тем более осмыслить не успел.
Диалог пропал напрочь и куда неизвестно.
Сегодня такая фигня случилась.
Из потерянного уловил только общий вывод, без частностей - обоснований.

Люблю когда отправка сообщение мышкой.

Неприятно, когда в разных программах по разному, где Ctrl+Enter а где Enter.
Набираешь на автомате и Бац фигня вышла.

Аватара пользователя
Советник
Сообщения: 8634
Зарегистрирован: 31 янв 2024, 15:48
Откуда: ГО город Грозный
Пол: Мужской

Обсуждение ИИ (искусственного интеллекта). Реальность, будущее, возможные проблемы.

#832 Сообщение Советник » 22 ноя 2025, 17:56

Диалог пропал напрочь и куда неизвестно.
Чтобы этого не было - следует копировать каждый абзац в ворд-файл, каждый раз, каждый вопрос и ответ.
И постоянно нажимать на "дискетку" созранить.

Для надежности, после сеанса общения с ИИ, следует дублировать всё в бумажный блокнот, при помощи шариковой ручки или карандаша.

Чемберлен 1
Сообщения: 11283
Зарегистрирован: 09 фев 2020, 19:24
Предупреждения: 1
Пол: Мужской

Обсуждение ИИ (искусственного интеллекта). Реальность, будущее, возможные проблемы.

#833 Сообщение Чемберлен » 22 ноя 2025, 18:00

Советник писал(а): 22 ноя 2025, 17:56 Для надежности, после сеанса общения с ИИ, следует дублировать всё в бумажный блокнот, при помощи шариковой ручки или карандаша.
Ну ну.
Делишься своим опытом. Похвально. Сколько карандашей исписал?

V_lad
Сообщения: 1047
Зарегистрирован: 04 фев 2023, 12:48
Пол: Мужской

Обсуждение ИИ (искусственного интеллекта). Реальность, будущее, возможные проблемы.

#834 Сообщение V_lad » 22 ноя 2025, 18:16

Задача для нейросетей

Добрый Фей предлагает использовать детские загадки для проверки способностей нейросетей.


Пример загадки: "Что бы спереди погладить надо сзади полизать?"


ManYacK сообщает, что его нейросеть ДипСик решила загадку за 6 секунд.


Добрый Фей утверждает, что это неправильный ответ.

Правильный ответ

Вопрос предполагает сравнение как минимум двух машин.


Возможны три ответа в зависимости от контекста: машина может быть у Пети, у папы Пети или у дяди Серёжи.

Подозрения на ботов

ManYacK подозревает, что на форуме могут быть боты, маскирующиеся под пользователей.


Чемберлен недоволен отправкой сообщений по Enter в ИИ ДС.


При нажатии Ctrl+Enter иногда пропадает весь диалог.


Чемберлен предпочитает отправку сообщений мышкой.

Рекомендации по сохранению данных

Советник предлагает копировать каждый абзац в Word-файл и сохранять.


Для надежности следует дублировать всё в бумажный блокнот.


Чемберлен иронично комментирует рекомендации Советника.


Аватара пользователя
Советник
Сообщения: 8634
Зарегистрирован: 31 янв 2024, 15:48
Откуда: ГО город Грозный
Пол: Мужской

Обсуждение ИИ (искусственного интеллекта). Реальность, будущее, возможные проблемы.

#836 Сообщение Советник » 22 ноя 2025, 20:17

Чемберлен писал(а): 22 ноя 2025, 18:00Ну ну.
Когда отключат электричество, ты сможешь растопить свою печурку валежником.
Но электронные устройства станут для тебя недоступными.
И всё что на них хранится - тоже станет по сути валежником.

Но информацию на бумаге ты сможешь перечитывать, искать там ответы на свои житейские вопросы.
А также передать своим потомкам как великое наследие :good:

Аватара пользователя
ManYacK
Сообщения: 25262
Зарегистрирован: 29 мар 2019, 10:19
Пол: Мужской

Обсуждение ИИ (искусственного интеллекта). Реальность, будущее, возможные проблемы.

#837 Сообщение ManYacK » 22 ноя 2025, 20:19

Чемберлен писал(а): 22 ноя 2025, 17:37 Привык большие тексты делить на абзацы - нужно жать Ctrl+Enter.
я уже а столько привык жать Shift+Enter (нейросети это тоже понимают). что так делаю автоматически и на форуме, и в редакторах.... раздражает зато никакого конфликта с отправкой неоконченного сообщения.
Последний раз редактировалось ManYacK 22 ноя 2025, 20:26, всего редактировалось 1 раз.

Big
Сообщения: 4869
Зарегистрирован: 16 апр 2019, 18:56
Пол: Мужской

Обсуждение ИИ (искусственного интеллекта). Реальность, будущее, возможные проблемы.

#838 Сообщение Big » 22 ноя 2025, 20:24

Советник, А печатная машинка?
Ну лайф хак купить принтер и распечатать? Что не?

Аватара пользователя
Советник
Сообщения: 8634
Зарегистрирован: 31 янв 2024, 15:48
Откуда: ГО город Грозный
Пол: Мужской

Обсуждение ИИ (искусственного интеллекта). Реальность, будущее, возможные проблемы.

#839 Сообщение Советник » 22 ноя 2025, 20:33

Big, да это вариант решения проблемы сохранения наследия, в виде бесценной информации сгенерированной средствами ИИ, пока еще доступными к использованию неограниченным кругом лиц.

Знакомые врачи кардиологи, специалисты по сердечным, сосудистым и психическим проблемам - советуют людям глубокого пожилого возраста, так сказать, "переписывать интернет в блокнотик".

То есть просто от руки записывать на бумагу всякую интересную им информацию, получаемую посредством доступа к сети интернет.

Это увлекательно и полезно, - они говорят, - для профилактики и торможения деменции, старческого слабоумия и прочих негативных возрастных изменений.

Big
Сообщения: 4869
Зарегистрирован: 16 апр 2019, 18:56
Пол: Мужской

Обсуждение ИИ (искусственного интеллекта). Реальность, будущее, возможные проблемы.

#840 Сообщение Big » 22 ноя 2025, 20:37

Советник, От деменции и на тонкую моторику лучше заняться чем нить более полезным чем переписыванием хрени - а потом исчо и почерк такой может быть что и без бутылки не разберешь, да после бутылки то же :)