📊 Статистика дайджестов

Всего дайджестов: 34123 Добавлено сегодня: 101

Последнее обновление: сегодня
Авторы:

Jason Lo, Mohammadnima Jafari

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
A wiring diagram is a labeled directed graph that represents an abstract concept such as a temporal process. In this article, we introduce the notion of a quasi-skeleton wiring diagram graph, and prove that quasi-skeleton wiring diagram graphs correspond to Hasse diagrams. Using this result, we designed algorithms that extract wiring diagrams from sequential data. We used our algorithms in analyzing the behavior of an autonomous agent playing a computer game, and the algorithms correctly identif...
ID: 2511.20138v1 cs.AI, cs.DM, cs.LG, math.CO
Авторы:

Florent Foucaud, Harmender Gahlawat, Fionn Mc Inerney, Prafullkumar Tale

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
The VC-dimension is a fundamental and well-studied measure of the complexity of a set system (or hypergraph) that is central to many areas of machine learning. We establish several new results on the complexity of computing the VC-dimension. In particular, given a hypergraph $\mathcal{H}=(\mathcal{V},\mathcal{E})$, we prove that the naive $2^{\mathcal{O}(|\mathcal{V}|)}$-time algorithm is asymptotically tight under the Exponential Time Hypothesis (ETH). We then prove that the problem admits a 1-...
ID: 2510.17451v1 cs.CC, cs.AI, cs.DM, cs.LG, math.CO
Авторы:

Moran Feldman, Amin Karbasi

## Контекст Недавние объявления от лабораторий самых передовых AI-систем показали впечатляющие результаты на тестах за средние и высшие школы, а также на университетских математических олимпиадах. Однако возникает вопрос: могут ли такие модели справиться с более сложными теоретическими задачами, такими как создание новых, простых утверждений в развитых областях математики? Для решения этого вопроса предлагается тест Гёдела: определить возможность модели произвести правильные доказательства для простых, до сих пор неразрешенных утверждений. ## Метод Мы использовали модель GPT-5 для изучения ее возможности решать проблемы в области комбинаторной оптимизации. Для каждой задачи предоставили одну или две исходные работы, из которых взят элемент задачи. Оценивались способность модели анализировать ситуацию и создавать корректные доказательства. Были использованы пять проблем, относящихся к разных сложностям, включая три простых и две более сложные. ## Результаты На простых задачах GPT-5 показала способность вывести практически верные решения. На одной задаче средней сложности она даже предложила другой гарантийный результат, который опровергла наше утверждение, но при этом дала верное решение. На более сложной задаче, которая требовала синтеза информации из нескольких источников, модель не справилась. На самой сложной задаче, не имеющей уже проверенных доказательств, модель GPT-5 предложила те же выводы, что и мы, но не смогла справиться с анализом этого решения. ## Значимость Результаты показывают, что модель GPT-5 успешно решает простые задачи, включая некоторые элементы оригинального мышления. Однако она столкнулась с трудностями при работе с задачами, требующими синтеза информации из разных источников. Это указывает на существенный прогресс в области рационального рассуждения и возможность использования таких моделей в будущем, но также подчеркивает ограничения, особенно при необходимости кросс-документального анализа. ## Выводы Результаты экспериментов с GPT-5 показывают существенный прогресс в области математического моделирования и анализа. Однако остаются трудности при сложных задачах, требующих кросс-документального анализа. Дальнейшие исследования будут направлены на улучшение моделей, чтобы они могли пройти тест Гёдела и стать инструментом для решения более сложных задач в математике.
Annotation:
Recent announcements from frontier AI model labs have highlighted strong results on high-school and undergraduate math competitions. Yet it remains unclear whether large language models can solve new, simple conjectures in more advanced areas of mathematics. We propose the G\"odel Test: evaluating whether a model can produce correct proofs for very simple, previously unsolved conjectures. To this end, we study the performance of GPT-5 on five conjectures in combinatorial optimization. For each p...
ID: 2509.18383v1 cs.AI, cs.DM, cs.LG