Лучшие сообщения Bulldozer

Bulldozer

А, Б, В, Г, Д играют в мафию. Среди них два мафиози, два мирных жителя и комиссар. Мафиози знают только друг друга, комиссар знает роль каждого, мирные жители не знают роли других игроков. Мафиози лгут. Комиссар и мирные жители говорят правду.

Полилог
А: Я не знаю, кто Б
Б: Я знаю, кто комиссар
В: Я знаю, кто А
Г: Я знаю, что В - комиссар

Кто Д?

Непонятно, кто Д. Возможны эти две комбинации:

ММКЖЖ
ЖМКЖМ

Bulldozer

Хочу сделать длительный тест движков на сложных задачах. Время на решение, наверное, полчаса или час - пока не знаю сколько именно лучше.
Костяк - те задачи Nightmare, которые не решаются за пять минут всеми движками. Плюс, стоит добавить ещё других. Если у вас есть что добавить, присылайте.
Тест будет проходить, прежде всего T60 - новые выходящие версии время от времени. Ещё, вероятно, Стокфиш 11.

Bulldozer

В первой задаче А сразу обоих сдал, если он маф

Почему? А по сути вообще никакой инфы про Б не дал, кроме той, что Б теперь чаще комиссар (А ведь отказался от комиссарства). А и мирным, и мафом скажет, что не знает, кто Б.

Bulldozer

Апдейт таблицы - добавил 12 заданий из Hard Talkchess 2020. Добавлял только те, которые не решил там никакой движок.

Bulldozer

Да и пофиг тут в любом случае - корабли 1 и 2 всё равно возвращаются на базу для заправки. А потом они могут плыть по кратчайшему расстоянию до корабля 3. Та же эта долгота или противоположная - будет то же самое.

Bulldozer

Замечу, что сеть SV-384x30-T60-3010, победившая Stockfish, показала один из худших результатов в нашем тестировании. У меня нет никакого объяснения этому. Понятно, что им не нужно было думать полчаса над каждым ходом и они выпустили играть сеть, которая лучше играет с нормальным контролем, а не VLTC или БА.

Bulldozer

Пользователь @аленари-вариолис написал в Математические и логические задачи:

там огибать же и с другой стороны возвращаться, не плоская же планета

Можно сказать, что плоская для наших целей.
По условию задачи кругосветное плаванье - это "доплыть до южного полюса и вернуться обратно". Обратно, Карл.

Bulldozer

Я заказал такой ноутбук для игр и шахмат:
Dell G5 15
Выглядит очень секси по мне.

0_1564147415708_laptop-g-series-g5-15-5590-nontouch-notebook-pdp-mod-6.jpg

Конфигурация

CPU: Core i7-8750H (6 cores)
Graphics: NVIDIA GeForce RTX 2060 6GB GDDR6
RAM: 16 GB
Storage: SSD 256 GB + HDD 1 TB

Купил в магазине Dell на ebay со всякими скидками за AUD $1949. А на сайте Dell цена сейчас указана на 50% выше. Просто офигеть разница.

Ноутбук буду сразу апгрейдить — вместо механического винта поставлю 1 TB SSD и добавлю ещё 16 GB памяти.
И монитор вот такой: Acer Predator XB241H FHD 144Hz G-Sync 24in
Это всё уже купил, и что-то даже уже пришло.
Сам ноутбук ожидается только в середине августа.

На этот ноутбук много нареканий по поводу перегрева. Наверное, поэтому на него дают такую скидку. Но у меня есть план, как уменьшить потенциальный перегрев: замена термопасты, даунвольтинг, подставка под корпус.

Теперь приятные графики, как 2060 играет в шахматы:

В 32-битном режиме:

0_1564146738997_Screenshot from 2019-07-26 23-11-53.png

В 16-битном режиме:

0_1564146752970_Screenshot from 2019-07-26 23-11-36.png

Поколение GTX не умеет 16 бит, и их цифры останутся как на первом графике. Т.е., наша 2060 будет рвать топовую карту предыдущего поколения 1080Ti как Тузика: 14758 против 6633.

Т.е., у нас будет реально продвинутая видюха для шахмат, хотя и не топовая. 2080 Ti, конечно, хотелось бы, но всё-таки она одна стоит почти как этот ноутбук. Мало у кого пока есть, думаю.

Bulldozer

Да, сейчас поправлю. А ещё у меня корапь 2 слишком быстро приехал обратно на базу. 1 апреля не должен ещё прибыть. Сейчас поправлю.

Bulldozer

Да, облачные вычисления для шахмат возможны и не очень дороги, видимо. Просто видеокарта мне нужна была для игр в любом случае.

Вот здесь написано, что у NVIDIA TeslaT4, которую предлагает Google Cloud, производительность в режиме FP16 (лучший режим для Лилы) равна 65 TFLOPS.

0_1566527888434_Screenshot from 2019-08-23 12-37-55.png

Вот здесь написано, что стоит T4 $0.29 за час на Google Cloud.

0_1566527184373_Screenshot from 2019-08-23 12-25-55.png

Вот здесь написано, что моя RTX 2060 имеет производительность 12.9 TFLOPS в том же режиме.

0_1566527851406_Screenshot from 2019-08-23 12-37-19.png

Вот здесь написано, что RTX 2060 стоит US $360.

0_1566528053111_Screenshot from 2019-08-23 12-40-39.png

Итого.
T4 стоит $0.29 в час и имеет производительность 65 TFLOPS.
RTX 2060 стоит $360 и имеет производительность 12.9 TFLOPS.
Подсчитаем, сколько часов можно гонять движок на T4 на Google Cloud, заплатив при этом стоимость своей видеокарты. При этом, учтём разницу в производительности.
~~(360 / 0.29) * (12.9 / 65) = 246~~
(360 / 0.29) * (65 / 12.9) = 6255
Т.е., вместо покупки такой видеокарты можно купить ~~246~~ 6255 часов работы T4 на Google Cloud с примерно тем же результатом.

Один турнир - 10 партий по 40 ходов по 1 часу на ход - это нужно 400 часов работы, а не 246. Ну, ещё прикинем трату электроэнергии в случае со своей видеокартой (~5 центов в час). Всё равно получается, что для активной игры по переписке, когда играется много партий, имеет больше смысла покупать видеокарту, а не использовать облачные сервисы. Довольно быстро окупится. Хотя, она тянет и компьютер за собой, если его нет...

Update:
Вау, ошибка в формуле. В 25 раз! Правильно так:
(360 / 0.29) * (65 / 12.9) = 6255. Исправил выше.
Это всё меняет. Получается, за цену видеокарты можно очень долго использовать T4 на Google Cloud?

Bulldozer

Вроде поправил.

Bulldozer

Участник @xajik написал в Движки:

Я так понял( совершенно не вникая и совершенно не разбираясь в вопросе), что

Я тоже пока не большой специалист.

Обучается нейросеть на партиях ( механизмы разные, в том числе на самообучении , но в последнее время и наигрывая даже с любыми пожелавшими поучаствовать).

Да, почти всё на самообучении. Игра с другими, наверное, всё-таки больше для контроля, потому что там партий не так много, чтобы обучать.

Обученная сеть ( и их уже достаточно много и они как-то различаются по характеристикам) выкладывается в доступ.

Да. Сетей выложена тьма, и надо ещё знать, какую лучше скачать.

Любой желающий скачивает уже готовуюсеть на свои ресурсы и использует при игре, в зависимости от железа будет разная глубина и скорость анализа, но в целом тут все примерно в одном положении.

Да.

Отсюда вопросы новичка ( чтобы расставить по местам и др. причинам, это может быть полезным):

Сколько сетей люди обучают сами , по другим характеристикам ( например, играют только французскую или только определенные структуры) ?. Читал недавно по сетям по эндшпилям, но это была маленькая сеть и в что-то серьезное не развилось - в той ссылке-больше не знаю. Возможно, что сетки развиваются хорошо по разным "шахматным темам")

Есть энтузиасты, которые что-то там децентрализованно обучают. Да, типа какие-то отдельные нюансы шахмат. Не знаю, насколько их много и не уверен, что это сильно полезно.

Сколько по ресурсам обучить шахматную среднюю сеть на среднем железе ( или облаке со средними данными). Хотя бы примерные данные. Время, количество данных/партий и другое.

Тут временные рамки сложно провести. Ну, вот Лилу уже год или уже больше обучают достаточно много людей. А так, чтобы играла на 3-й разряд - наверное, и один человек со своей видеокартой справится за какое-то разумное время.

Есть ли смысл ( скорее всего есть, но непонятно в каких направлениях) обучать свою сеть/подсеть. Добавлять свою сеть ( подсеть), обучая ее по своим характеристикам( например, Комсюк решил играть в турнире французские структуры- обучаем сеть на таких данных). Обучать можно и на странных в первом взгляде характеристиках- повышение общей результативности ( агрессивность) и т.п.

Т.е., типа взять лучшую на данный момент сеть, переписать обучающий скрипт, чтобы ставил только французскую защиту и начать обучать? Думаю, прибавку в силе особо не заметишь. И пока будешь обучать, основная сеть, над которой трудится много энтузиастов, уйдёт далеко вперёд по силе, и не будет смысла использовать свою.

Обучить совсем маленькую сеть совсем несложно, тут совсем не нужно даже быть специалистом.

А, по-моему, что большая, что маленькая - нужно быть одинаково хорошим специалистом. Просто большая требует больше вложений времени на обучение.

Тут чаще вопрос- на чем обучать, с какими целями, на каких тонкостях и данных такие небольшие подсети ( то есть может ли это дать выгоду и какую по отношению к тем, кто этого не делает).

Думаю, выгоду трудно будет извлечь.

То есть вопрос- не использовать лишь готовое, но и придумать что-то дополнительное-. Как в этом направлении работают- какие есть данные? Кроме нейросетей ведь много по анализу данных и ИИ.

Можно работать в направлении улучшения алгоритма поиска MCST (и его параметров), который используется в LC0. Или какой-нибудь другой алгоритм придумать.

Bulldozer

Ну, уже всё прекрасно получается - у Халка же правильное решение.
Моё решение - заставлять есть кол-во еды, пропорциональное скорости поедания. Оно не является оптимальным.

Bulldozer

Пост, в общем-то, посвящается @Комс.

Меня не устраивает ширина поиска в Лиле и я играюсь с настройками с целью сделать так, чтобы слабые ходы получали больше времени.

В Лиле используется алгоритм UCT, и есть такая формула (1):

Cpuct' = Cpuct + CpuctFactor * ln((Nodes + CpuctBase)/CpuctBase)

Это была основная формула. Можно, если нужно, выразить Nodes. Формула (2):

Nodes = CpuctBase * (e^((Cpuct' - Cpuct)/CpuctFactor) - 1)

Или выразить CpuctBase. Формула (3):

CpuctBase = Nodes / (e^((Cpuct' - Cpuct)/CpuctFactor) - 1)

Объясню формулу (1). Это всё конфигурационные параметры движка, кроме Cpuct' (это вычисляемый) и Nodes (сколько просмотрено узлов на данный момент при анализе ДАННОГО узла).
Из описания алгоритма известно, что баланс exploitation - exploration сдвигается вправо тем больше, чем больше Cpuct'. Т.е., чтобы поиск сделать шире, нужно увеличивать Cpuct', чего можно достичь увеличением Cpuct, или CpuctFactor, или уменьшением CpuctBase. И, само собой, при увеличении Nodes поиск расширяется автоматически.
Для каждого хода-кандидата вычисляется его приоритетность, а именно Cpuct' плюс некоторое слагаемое, с которым я особо не разбирался пока (оно зависит от оценки хода), и выбирается тот ход-кандидат, у которого сумма больше. Т.е., приоритетность хода-кандидата зависит от нодесов, просмотренных во время анализа этого хода ранее, от оценки хода и от конфигурационных параметров.

По дефолту такие значения:

? = 3 + 2 * ln((Nodes + 19652)/19652)

При дефолтных значениях динамика получается следующая.
Когда Nodes = 0 (т.е., свежий ход), то Cpuct' = 3.
Когда Nodes = 33K, то Cpuct' = 5.
и т.д., вот таблица:

Nodes	Time*	Cpuct'
0	0	3
33K	3 sec	5
125K	12 sec	7
375K	37 sec	9
1M	100 sec	11
3M	5 min	13
8M	13 min	15
22M	37 min	17
59M	98 min	19

*Время указано на моей текущей конфигурации железа и софта. Может отличаться для разных видеокарт и нейросетей. Для справки: на RTX 2060 с нейросетью T40B.4-260 скорость расчёта примерно 10K nodes/sec = 600 Knodes/min = 36M nodes/hr.
Указано потраченное время только на обдумывание этого хода, но не других ходов-кандидатов.

Если я держу движок уже 13 минут на ходе (причём, это означает общее время анализа уже намного больше, если этот ход не на первой линии!), то мне кажется, это значит, что я хочу уже широкого анализа, а не додрачивания оценки лучшего хода. Меня как-то не очень устраивает, что Cpuct' для 5 минут и 13 минут отличается так мало. Временно снимается - пока не понимаю полностью, как это всё работает.

Можно крутить CpuctBase. Я ещё буду дописывать этот пост.

Bulldozer

@exhibeo
100 пионеров смогут повторить, а 200 уже повторили.

Bulldozer

Участник @комс написал в Движки:

поищи в инете тест "ночной кошмар II", не помню, как по-английски
Там есть даже поза из Полугаевский - Торре, 1982

Или завтра скину
Но оболочка Фритц будет нужна, как ни крути

Запустил в пакетном режиме (помнишь, для тебя делал? - пригодился) все 30 задач оттуда, по 7 минут на каждую. Когда отработает, проверю сколько правильных решений. Потом будем и другие сетки так проверять, и другие настройки.

Bulldozer

Могу периодически пока, но мне надоест быстро.
По-хорошему, это лучше чат интегрировать с API и платить деньги за доступ, правда, немного. Но возни очень много.

Bulldozer

Две картинки о том, как важен параметр NNCacheSize в Лиле. Это размер кэша нейронной сети, выраженный в максимальном кол-ве сохраняемых позиций.
И почему его нельзя оставлять по умолчанию.

В первом эксперименте NNCacheSize установлен по умолчанию (200K).
Во втором эксперименте он увеличен в 100 раз и равен 20M.

В первом эксперименте кэш быстро заполнился (синяя линия), после чего скорость перебора позиций (красная линия) расти перестала, т.е., многие позиции идут на расчёт в видеокарту. Жёлтая линия - общее число просмотренных позиций - за час поднялась до 26K.

В втором эксперименте кэш даже к концу заполнился лишь на две трети (синяя линия). Скорость перебора позиций (красная линия) расти не переставала, т.е., многие позиции брались из кэша, а чем больше кэш, тем больше вероятность найти в нём позицию. Жёлтая линия - общее число просмотренных позиций - за час поднялась до 70K.

Вот так только настройкой кэша ускорили движок в 2.5 раза.

0_1570966820751_Screenshot from 2019-10-13 22-39-56.png

0_1570966613065_Screenshot from 2019-10-13 22-34-05.png

Bulldozer

Чел продуманный. Явно ещё не поджигал.