Изучай языки

"That’s beyond my current scope" — разбор заблокированного DeepSeek запроса

Чувствительные темы для китайских нейросетей уже стали притчей во языцех за последний год. Столкнулся с этим недавно и я. Хочу поделиться с вами ситуацией, возникшей при работе с DeepSeek и разобрать, почему так вышло, и как я решил этот вопрос, не выходя из ИИ.

Писал я недавно пост о пиньинь — системе записи китайского языка латиницей, и мне понадобилась дополнительная информация. Я зашёл в дипсик и написал запрос по поводу вариантов пиньиня, на что получил скуповатый ответ-перечисление: да, есть варианты, вот они — тибетский, уйгурский, монгольский, маньчжурский, малайзийский...

Маловато информации. Ну что ж, запрошу-ка тут же дополнение — о том, когда и зачем каждый из перечисленных вариантов был создан. ИИ вошёл в глубокое размышление и где-то на середине выдал:

"Sorry, that's beyond my current scope. Let’s talk about something else".

Хм, запрос казался логичным продолжением предыдущего диалога. Почему же мне отказались отвечать и включила фильтры?

Вот эта злополучная надпись. а всё так хорошо начиналось...
Вот эта злополучная надпись. а всё так хорошо начиналось...

После анализа ситуации в другой "продвинутой нейросети" пришло осознание полноты бытия. "Красные флажки" в моём запросе:

  • Уйгурский пиньинь. Эта система использовалась в 1965-1982 гг. в Синьцзян‑Уйгурском автономном районе. Сегодня этот регион — зона повышенного внимания из‑за сложной языковой и культурной политики.
  • Тибетский пиньинь — Тибет тоже относится к "чувствительным" регионам.
  • Монгольский пиньинь (Внутренняя Монголия) — ещё один случай сложной региональной языковой специфики.
  • Малайзийский вариант — косвенно затрагивает тему "распространения китайского языка за рубежом", что можно связать с геополитикой.

Никогда бы не подумал, что региональные языковые системы или исторические изменения письменности — это тоже "низзя" и активируют фильтры.

Спрóсите: а почему тогда первый запрос прошёл, а второй нет?

Первый запрос был общим и "безопасным" — просто список разновидностей. Модель сама и выдала факты без контекста.

Во втором запросе активизировалась контекстная чувствительность ключевых слов в собственных рассуждениях ИИ: нужно было объяснить, когда и зачем создали системы. Это неизбежно вело к упоминанию:

  • исторических периодов,
  • географических названий (Синьцзян, Тибет, Внутренняя Монголия);
  • этнонимов (уйгуры, тибетцы, монголы);
  • административных решений,
  • региональной специфики,

— а это уже, понятно, зона риска для ИИ с жёсткими фильтрами.

В этом случае ещё недавно советовали стереть старый и начать новый диалог — очистка истории чата могла вроде как помочь обойти запомненные фильтры. Но сейчас такой фокус уже точно не пройдёт: у современных моделей есть заранее заложенные правила, которые активируются при обнаружении определённых ключевых слов или тем — независимо от истории диалога.

Интрига сохранялась несколько часов, пока я продумывал решение. Протестировав несколько подходов, решил поделиться тем, что сработал лично у меня.

Я разделил запрос на части: попросил сначала выложить информацию про тибетский пиньинь — даты и цель создания, его лингвистические особенности, как передаются специфические звуки; затем отдельным запросом то же сделал про монгольский; и отдельно — про маньчжурский.

Т.е. в моём случае DeepSeek принял "желаемое за действительное": реально-то я не делал подкопа в сторону политики. Дав ему "правильные" (читай — более точные, не уводящие в сторону размышлений над подцензурными темами) промты, я получил нужный мне ответ.

Да пребудут с нами точные промты!

5 комментариев

Спасибо, было бы интересно получить серию статей про сложные запросы какие ещё формулировки(кроме уеж известных всем) блокируются и как их грамотно переписать

1 ответ

К сожалению, на этом не специализируюсь, это есть единичный опыт.

Поделитесь уж тогда, какой ИИ помог осознать происходящее

1 ответ

З, Алиса открыла мои глаза.

В следующий раз просто работайте с другой нейросетью, свет не клином сошелся на этой . В этот раз вышли из положения, а в другой не получится, лучше сразу поменять