📊 Статистика дайджестов
Всего дайджестов: 34022 Добавлено сегодня: 0
Последнее обновление: сегодня
Авторы:
Hagen Holthusen, Ellen Kuhl
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
We propose a complement to constitutive modeling that augments neural
networks with material principles to capture anisotropy and inelasticity at
finite strains. The key element is a dual potential that governs dissipation,
consistently incorporates anisotropy, and-unlike conventional convex
formulations-satisfies the dissipation inequality without requiring convexity.
Our neural network architecture employs invariant-based input representations
in terms of mixed elastic, inelastic and structu...
Авторы:
Moritz von Tresckow, Ion Gabriel Ion, Dimitrios Loukrezis
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
This work develops a computational framework that combines physics-informed
neural networks with multi-patch isogeometric analysis to solve partial
differential equations on complex computer-aided design geometries. The method
utilizes patch-local neural networks that operate on the reference domain of
isogeometric analysis. A custom output layer enables the strong imposition of
Dirichlet boundary conditions. Solution conformity across interfaces between
non-uniform rational B-spline patches is ...
Авторы:
Jannick Kehls, Ellen Kuhl, Tim Brepols, Kevin Linka, Hagen Holthusen
#### Контекст
Исследование сферы применения нейронных сетей в решении задач моделирования непрерывных сред становится все более актуальным в связи с ростом потребности в эффективных алгоритмах, позволяющих сократить вычислительные затраты при сохранении точности решений. Особую проблему представляют модели, требующие высокой ресурсоемкости для построения точных решений. Данная работа фокусируется на развитии нейросетевого фреймворка для решения задач моделирования в рамках непрерывных систем, обеспечивающего объединение высокой точности и эффективности.
#### Метод
Предложенный фреймворк основывается на автоэнкодере (Autoencoder), который позволяет сократить размерность высокомерных решений с помощью нейронных сетей. Основная идея заключается в трех этапах. В первом этапе используется неуправляемый Autoencoder для сжатия высокоразмерных решений натуральных элементов в компактное пространство. Во втором этапе реализуется супервизированное обучение сети, реализующей закон подгонки, чтобы обучать сеть сопоставлять входные параметры с кодами из пространства сжатия. На третьем этапе внедряется суррогатная модель, которая моделирует полнофактное решение на основе входных параметров, используя построенную сеть. Для улучшения точности вводятся расширения: (i) версия с учетом сил для предсказания дисплейных полей и реакционных сил на граничных условиях и (ii) многополевая модель, расширяющая модель для решения сложных систем, таких как термомеханические системы.
#### Результаты
Работа подтверждает высокую точность построения моделей как на стандартных бенчмарках, так и на сложных задачах в непрерывных системах. Описанные расширения (сил и многополей) успешно расширяют возможности фреймворка, позволяя его применять в системах с полями, связанными друг с другом (например, термомеханические системы). Использовались данные в различных сценариях, включая анизотропную эластичность, геометрические колебания и сочетание теплопроводности с деформациями. Результаты показали, что построенная модель обеспечивает высокую точность в реконструкции решений, сохраняя гибкость и эффективность.
#### Значимость
Предложенный фреймворк отлично подходит для приложений в области непрерывных систем, где необходима экономия ресурсов при сохранении точности. Он может быть использован в сетевых решениях для работы с динамическими системами, в сочетании с технологиями увеличения эффективности моделей. Это расширяет перспективы для разработки удобных и эффективных алгоритмов, например, в сфере дигитальных дигиталов и анализа неопределенности.
#### Выводы
Результаты работы демонстрируют эфф
Annotation:
We propose a non-intrusive, Autoencoder-based framework for reduced-order
modeling in continuum mechanics. Our method integrates three stages: (i) an
unsupervised Autoencoder compresses high-dimensional finite element solutions
into a compact latent space, (ii) a supervised regression network maps problem
parameters to latent codes, and (iii) an end-to-end surrogate reconstructs
full-field solutions directly from input parameters.
To overcome limitations of existing approaches, we propose two ...
Авторы:
Yuanjun Feng, Vivek Choudhary, Yash Raj Shrestha
## Контекст
Обширное использование бо LLM (Large Language Models) в сфере социальных наук позволяет эмулировать сложные процессы с точки зрения имитации человеческого мышления. Однако, несмотря на успехи в распознавании текста, логических задач и оптимизации, способность этих моделей воспроизводить человеческую разнообразность в поведении и способность адаптироваться к разным ситуациям остается мало исследована. Особенно это актуально в ситуациях, где модели применяются для моделирования решений в условиях неопределенности и волатильности. Наша исследовательская мотивация состоит в том, чтобы разработать рамочный подход для оценки LLM в контексте этих недостатков, сфокусировавшись на их уровней логической и стратегической адаптации.
## Метод
Мы предлагаем процессно-ориентированный подход к оценке LLM, включая три уровня вмешательств: Интрисикальность (Intrinsicality), Инструкция (Instruction) и Имитация (Imitation). **Интрисикальность** исследует логические и стратегические характеристики модели без дополнительных указаний. **Инструкция** применяет различные указания, чтобы измерить поведение модели в условиях стратегического руководства. **Имитация** вводит элементы человеческих тенденций, которые модель должна воспроизвести. Мы проверяем этот подход на двух классических экономических задачах: **иррациональности во вторичном торге аукционов** и **упущения в решении проблемы новострейджера (newsvendor problem)**. Эти задачи позволяют изучить, насколько LLM могут воспроизвести человеческий уровень риска, предпочтений и стратегических решений.
## Результаты
Мы обнаружили, что LLM, по умолчанию, приходят к устойчивым, но скромным стратегиям, которые отстают от реальных поведенческих тенденций человека. Указания о риске (risk-framed instructions) оказали сковывающий эффект, приводя к более консервативным решениям, но не достигая человеческой разнообразности. Добавление человеческих данных в **in-context learning** уменьшило промежуток в поведении, но не создало желаемой громадности вариативности. Эти результаты показывают, что, несмотря на успех в распознавании, LLM все еще существенно отстают в полноценной адаптации к социально-экономическим моделям.
## Значимость
Наша работа может быть применена в синтетическом моделировании, особенно в социальных науках, где человеческий поведенческий аспект играет ключевую роль. Это позволяет систематически оценить, насколько LLM могут удовлетворить важные критерии воспроизведения реальности в моделях системных решений. Кроме того, наш подход может помочь улучить их доверительность в решениях, где важность человеческого
Annotation:
Large language models (LLMs) are increasingly used in social science
simulations. While their performance on reasoning and optimization tasks has
been extensively evaluated, less attention has been paid to their ability to
simulate human decision-making's variability and adaptability. We propose a
process-oriented evaluation framework with progressive interventions
(Intrinsicality, Instruction, and Imitation) to examine how LLM agents adapt
under different levels of external guidance and human-d...
Авторы:
Magnus Bengtsson
Огромные языковые модели, хотя и эффективны, требуют больших ресурсов для обучения и работы, что ограничивает их применение в устройствах с ограниченными мощностями и высокими требованиями к производительности. В статье "Compressing Large Language Models with PCA Without Performance Loss" авторы рассматривают метод сжатия моделей с помощью главных компонент анализа (PCA), позволяющий сократить модели без ущерба для их качества. Авторы демонстрируют результаты этого подхода на разных задачах, включая задачу классификации MNIST, обучение трансформера на данных 20 Newsgroups и генерацию токенов с помощью transformer-декодера. Они доказывают, что PCA-сжатие позволяет сократить модели до 17% от оригинального размера, при этом сохраняя высокую точность и гранулярность. Этот подход предлагается как эффективный способ уменьшить требования ресурсов для языковых моделей без потери качества.
Annotation:
We demonstrate that Principal Component Analysis (PCA), when applied in a
structured manner, either to polar-transformed images or segment-wise to token
sequences, enables extreme compression of neural models without sacrificing
performance. Across three case studies, we show that a one-layer classifier
trained on PCA-compressed polar MNIST achieves over 98 percent accuracy using
only 840 parameters. A two-layer transformer trained on 70-dimensional
PCA-reduced MiniLM embeddings reaches 76.62 pe...
Показано 21 -
25
из 25 записей