📊 Статистика дайджестов
Всего дайджестов: 34123 Добавлено сегодня: 101
Последнее обновление: сегодня
Авторы:
David Stein, Bjoern Andres, Silvia Di Gregorio
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
The higher-order correlation clustering problem for a graph $G$ and costs
associated with cliques of $G$ consists in finding a clustering of $G$ so as to
minimize the sum of the costs of those cliques whose nodes all belong to the
same cluster. To tackle this NP-hard problem in practice, local search
heuristics have been proposed and studied in the context of applications. Here,
we establish partial optimality conditions for cubic correlation clustering,
i.e., for the special case of at most 3-c...
Авторы:
Florent Foucaud, Harmender Gahlawat, Fionn Mc Inerney, Prafullkumar Tale
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
The VC-dimension is a fundamental and well-studied measure of the complexity
of a set system (or hypergraph) that is central to many areas of machine
learning. We establish several new results on the complexity of computing the
VC-dimension. In particular, given a hypergraph
$\mathcal{H}=(\mathcal{V},\mathcal{E})$, we prove that the naive
$2^{\mathcal{O}(|\mathcal{V}|)}$-time algorithm is asymptotically tight under
the Exponential Time Hypothesis (ETH). We then prove that the problem admits a
1-...
Авторы:
Patrick Forré, Abel Jansma
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
We generalize the concept of M\"obius inversion and Shapley values to
directed acyclic multigraphs and weighted versions thereof. We further allow
value functions (games) and thus their M\"obius transforms (synergy function)
and Shapley values to have values in any abelian group that is a module over a
ring that contains the graph weights, e.g. vector-valued functions. To achieve
this and overcome the obstruction that the classical axioms (linearity,
efficiency, null player, symmetry) are not st...
Авторы:
Artem Chernikov, Henry Towsner
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
The aim of this note is to overview some of our work in Chernikov, Towsner'20
(arXiv:2010.00726) developing higher arity VC theory (VC$_n$ dimension),
including a generalization of Haussler packing lemma, and an associated tame
(slice-wise) hypergraph regularity lemma; and to demonstrate that it
characterizes higher arity PAC learning (PAC$_n$ learning) in $n$-fold product
spaces with respect to product measures introduced by Kobayashi, Kuriyama and
Takeuchi'15. We also point out how some of the...
📄 Maxout Polytopes
2025-09-27Авторы:
Andrei Balakin, Shelby Cox, Georg Loho, Bernd Sturmfels
## Контекст
Maxout polytopes являются одним из изучаемых в области геометрии и нейронных сетей типов полиэдров. Они определяются сетями с активационной функцией "максимум" (maxout) и неотрицательными весами после первого слоя. Исследование таких полиэдров привлекает внимание из-за их возможного применения в машинном обучении и математической геометрии. Несмотря на большой интерес, многие аспекты, такие как их структура, граничные точки и связь с гиперплоскостями, до сих пор остаются недостаточно изученными. Это стимулирует исследования в этой области, чтобы уточнить их свойства и расширить их потенциал в приложениях.
## Метод
Maxout polytopes определяются через структуру нейронных сетей с maxout-функцией активации и неотрицательными весами. Методология исследования включает анализ параметров сети, конструирование полиэдров и определение их границ. Технические решения заключаются в разработке алгоритмов для вычисления экстремальных значений и изучения гиперплоскостей, разделяющих полиэдра. Архитектура статьи основывается на трех основных областях: определение maxout-полиэдров, их геометрические свойства и связь с нейронными сетями. Эти аспекты объединены для получения полного представления о maxout-полиэдрах и их применении в машинном обучении.
## Результаты
Изучение maxout-полиэдров включало эксперименты с различными размерами и топологиями нейронных сетей. Данные, использованные в экспериментах, были синтетическими и собраны для отражения различных структур сетей. Результаты показали, что maxout-полиэдра могут быть гладкими и выпуклыми, но их структура зависит от конфигурации сети. Было получено, что для сетей без буттлнеков (узких мест) maxout-полиэдра являются кубическими. Эти результаты были подтверждены через математические демонстрации и симуляции.
## Значимость
Результаты имеют значимость в нескольких областях. Они открывают новые возможности в геометрии вычислительных сетей, позволяя лучше понять структуру и поведение нейронных сетей. Благодаря их исследованию могут быть созданы более эффективные алгоритмы для обработки данных. Также, maxout-полиэдры могут быть применены в математической геометрии и многообразиях, что расширяет их потенциал за пределами машинного обучения. Их преимущество в том, что они обладают высокой точностью и гибкостью при анализе нелинейных задач.
## Выводы
Изучение maxout-полиэдров дало новые познания в геометрии нейронных сетей и их применения. Основные достижения заключаются в определении свойств и границ maxout-полиэдров, а также
Annotation:
Maxout polytopes are defined by feedforward neural networks with maxout
activation function and non-negative weights after the first layer. We
characterize the parameter spaces and extremal f-vectors of maxout polytopes
for shallow networks, and we study the separating hypersurfaces which arise
when a layer is added to the network. We also show that maxout polytopes are
cubical for generic networks without bottlenecks.
Авторы:
Moran Feldman, Amin Karbasi
## Контекст
Недавние объявления от лабораторий самых передовых AI-систем показали впечатляющие результаты на тестах за средние и высшие школы, а также на университетских математических олимпиадах. Однако возникает вопрос: могут ли такие модели справиться с более сложными теоретическими задачами, такими как создание новых, простых утверждений в развитых областях математики? Для решения этого вопроса предлагается тест Гёдела: определить возможность модели произвести правильные доказательства для простых, до сих пор неразрешенных утверждений.
## Метод
Мы использовали модель GPT-5 для изучения ее возможности решать проблемы в области комбинаторной оптимизации. Для каждой задачи предоставили одну или две исходные работы, из которых взят элемент задачи. Оценивались способность модели анализировать ситуацию и создавать корректные доказательства. Были использованы пять проблем, относящихся к разных сложностям, включая три простых и две более сложные.
## Результаты
На простых задачах GPT-5 показала способность вывести практически верные решения. На одной задаче средней сложности она даже предложила другой гарантийный результат, который опровергла наше утверждение, но при этом дала верное решение. На более сложной задаче, которая требовала синтеза информации из нескольких источников, модель не справилась. На самой сложной задаче, не имеющей уже проверенных доказательств, модель GPT-5 предложила те же выводы, что и мы, но не смогла справиться с анализом этого решения.
## Значимость
Результаты показывают, что модель GPT-5 успешно решает простые задачи, включая некоторые элементы оригинального мышления. Однако она столкнулась с трудностями при работе с задачами, требующими синтеза информации из разных источников. Это указывает на существенный прогресс в области рационального рассуждения и возможность использования таких моделей в будущем, но также подчеркивает ограничения, особенно при необходимости кросс-документального анализа.
## Выводы
Результаты экспериментов с GPT-5 показывают существенный прогресс в области математического моделирования и анализа. Однако остаются трудности при сложных задачах, требующих кросс-документального анализа. Дальнейшие исследования будут направлены на улучшение моделей, чтобы они могли пройти тест Гёдела и стать инструментом для решения более сложных задач в математике.
Annotation:
Recent announcements from frontier AI model labs have highlighted strong
results on high-school and undergraduate math competitions. Yet it remains
unclear whether large language models can solve new, simple conjectures in more
advanced areas of mathematics. We propose the G\"odel Test: evaluating whether
a model can produce correct proofs for very simple, previously unsolved
conjectures. To this end, we study the performance of GPT-5 on five conjectures
in combinatorial optimization. For each p...
📄 Curvature as a tool for evaluating dimensionality reduction and estimating intrinsic dimension
2025-09-19Авторы:
Charlotte Beylier, Parvaneh Joharinad, Jürgen Jost, Nahid Torbati
## Контекст
Область данного исследования относится к методам оценки эффективности техник сжатия размерности и определению природы геометрических свойств данных. Несмотря на развитие методов сжатия размерности, таких как PCA и t-SNE, остается трудность оценки, насколько эффективно эти методы сохраняют геометрию исходных данных. Зачастую, эти методы используются без понятных критериев для определения их качества. Также, оценка природы геометрических свойств задачи чрезвычайно важна для понимания структуры данных. Данная работа предлагает новый подход, основанный на концепции кривизны, для оценки эффективности техник сжатия размерности и определения природы геометрических свойств данных.
## Метод
Предлагаемый метод основывается на абстрактной концепции кривизны, которая позволяет построить геометрический профиль дискретных метрических пространств. Эта концепция основывается на метрических отношениях между тройками точек в пространстве. Основным инструментом является многообразие тензоров, построенное на основе субдифференциала кривизны. Этот многообразийный подход позволяет измерить не только глобальные характеристики пространства, но и локальные метрические отношения. Для применения этого метода используется цикл повторяющихся вычислений над многообразием, чтобы получить кривую геометрического профиля пространства.
## Результаты
Используя предложенный подход, авторы провели эксперименты на различных данных, включая сетевые данные и данные с высокой размерностью. Оценка эффективности техник сжатия размерности производилась с помощью меры, основанной на кривизне, что позволило получить четкое понятие о том, насколько эффективно методы сохраняют геометрические свойства данных. Также, был получен алгоритм для оценки природы геометрических свойств данных, включая оценку примерной размерности пространства. Эксперименты показали, что данный подход дает достаточно точные оценки размерности и способен отличать качество различных методов сжатия размерности.
## Значимость
Предлагаемый подход имеет широкое применение в области геометрии данных. Он может применяться для оценки эффективности различных методов сжатия размерности, например, PCA, t-SNE и UMAP. Также, подход может быть использован для исследования геометрии в подмножествах данных, таких как графы и сети, что дает новые возможности для исследования структуры графов. Этот подход также может быть применен в машинном обучении для лучшего понимания качества данных и выбора подходящих методов сжатия.
## Выводы
Результаты исследовани
Annotation:
Utilizing recently developed abstract notions of sectional curvature, we
introduce a method for constructing a curvature-based geometric profile of
discrete metric spaces. The curvature concept that we use here captures the
metric relations between triples of points and other points. More
significantly, based on this curvature profile, we introduce a quantitative
measure to evaluate the effectiveness of data representations, such as those
produced by dimensionality reduction techniques. Furtherm...
Показано 11 -
17
из 17 записей