📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня

📄 A Complement to Neural Networks for Anisotropic Inelasticity at Finite Strains

2025-10-08

Авторы:

Hagen Holthusen, Ellen Kuhl

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

We propose a complement to constitutive modeling that augments neural networks with material principles to capture anisotropy and inelasticity at finite strains. The key element is a dual potential that governs dissipation, consistently incorporates anisotropy, and-unlike conventional convex formulations-satisfies the dissipation inequality without requiring convexity. Our neural network architecture employs invariant-based input representations in terms of mixed elastic, inelastic and structu...

ID: 2510.04187v1 cs.CE, cs.AI, 65, 74, I.6; J.2

arXiv PDF

📄 Multi-patch isogeometric neural solver for partial differential equations on computer-aided design domains

2025-10-02

Авторы:

Moritz von Tresckow, Ion Gabriel Ion, Dimitrios Loukrezis

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

This work develops a computational framework that combines physics-informed neural networks with multi-patch isogeometric analysis to solve partial differential equations on complex computer-aided design geometries. The method utilizes patch-local neural networks that operate on the reference domain of isogeometric analysis. A custom output layer enables the strong imposition of Dirichlet boundary conditions. Solution conformity across interfaces between non-uniform rational B-spline patches is ...

ID: 2509.25450v1 cs.CE, cs.AI, cs.NA, math.NA, physics.comp-ph, 68T07 (Primary), 78A30 (Secondary), J.2; J.6; I.2.m

arXiv PDF

📄 Autoencoder-based non-intrusive model order reduction in continuum mechanics

2025-09-05

Авторы:

Jannick Kehls, Ellen Kuhl, Tim Brepols, Kevin Linka, Hagen Holthusen

#### Контекст Исследование сферы применения нейронных сетей в решении задач моделирования непрерывных сред становится все более актуальным в связи с ростом потребности в эффективных алгоритмах, позволяющих сократить вычислительные затраты при сохранении точности решений. Особую проблему представляют модели, требующие высокой ресурсоемкости для построения точных решений. Данная работа фокусируется на развитии нейросетевого фреймворка для решения задач моделирования в рамках непрерывных систем, обеспечивающего объединение высокой точности и эффективности. #### Метод Предложенный фреймворк основывается на автоэнкодере (Autoencoder), который позволяет сократить размерность высокомерных решений с помощью нейронных сетей. Основная идея заключается в трех этапах. В первом этапе используется неуправляемый Autoencoder для сжатия высокоразмерных решений натуральных элементов в компактное пространство. Во втором этапе реализуется супервизированное обучение сети, реализующей закон подгонки, чтобы обучать сеть сопоставлять входные параметры с кодами из пространства сжатия. На третьем этапе внедряется суррогатная модель, которая моделирует полнофактное решение на основе входных параметров, используя построенную сеть. Для улучшения точности вводятся расширения: (i) версия с учетом сил для предсказания дисплейных полей и реакционных сил на граничных условиях и (ii) многополевая модель, расширяющая модель для решения сложных систем, таких как термомеханические системы. #### Результаты Работа подтверждает высокую точность построения моделей как на стандартных бенчмарках, так и на сложных задачах в непрерывных системах. Описанные расширения (сил и многополей) успешно расширяют возможности фреймворка, позволяя его применять в системах с полями, связанными друг с другом (например, термомеханические системы). Использовались данные в различных сценариях, включая анизотропную эластичность, геометрические колебания и сочетание теплопроводности с деформациями. Результаты показали, что построенная модель обеспечивает высокую точность в реконструкции решений, сохраняя гибкость и эффективность. #### Значимость Предложенный фреймворк отлично подходит для приложений в области непрерывных систем, где необходима экономия ресурсов при сохранении точности. Он может быть использован в сетевых решениях для работы с динамическими системами, в сочетании с технологиями увеличения эффективности моделей. Это расширяет перспективы для разработки удобных и эффективных алгоритмов, например, в сфере дигитальных дигиталов и анализа неопределенности. #### Выводы Результаты работы демонстрируют эфф

Annotation:

We propose a non-intrusive, Autoencoder-based framework for reduced-order modeling in continuum mechanics. Our method integrates three stages: (i) an unsupervised Autoencoder compresses high-dimensional finite element solutions into a compact latent space, (ii) a supervised regression network maps problem parameters to latent codes, and (iii) an end-to-end surrogate reconstructs full-field solutions directly from input parameters. To overcome limitations of existing approaches, we propose two ...

ID: 2509.02237v1 cs.CE, cs.AI, cs.LG

arXiv PDF

📄 Noise, Adaptation, and Strategy: Assessing LLM Fidelity in Decision-Making

2025-08-26

Авторы:

Yuanjun Feng, Vivek Choudhary, Yash Raj Shrestha

## Контекст Обширное использование бо LLM (Large Language Models) в сфере социальных наук позволяет эмулировать сложные процессы с точки зрения имитации человеческого мышления. Однако, несмотря на успехи в распознавании текста, логических задач и оптимизации, способность этих моделей воспроизводить человеческую разнообразность в поведении и способность адаптироваться к разным ситуациям остается мало исследована. Особенно это актуально в ситуациях, где модели применяются для моделирования решений в условиях неопределенности и волатильности. Наша исследовательская мотивация состоит в том, чтобы разработать рамочный подход для оценки LLM в контексте этих недостатков, сфокусировавшись на их уровней логической и стратегической адаптации. ## Метод Мы предлагаем процессно-ориентированный подход к оценке LLM, включая три уровня вмешательств: Интрисикальность (Intrinsicality), Инструкция (Instruction) и Имитация (Imitation). **Интрисикальность** исследует логические и стратегические характеристики модели без дополнительных указаний. **Инструкция** применяет различные указания, чтобы измерить поведение модели в условиях стратегического руководства. **Имитация** вводит элементы человеческих тенденций, которые модель должна воспроизвести. Мы проверяем этот подход на двух классических экономических задачах: **иррациональности во вторичном торге аукционов** и **упущения в решении проблемы новострейджера (newsvendor problem)**. Эти задачи позволяют изучить, насколько LLM могут воспроизвести человеческий уровень риска, предпочтений и стратегических решений. ## Результаты Мы обнаружили, что LLM, по умолчанию, приходят к устойчивым, но скромным стратегиям, которые отстают от реальных поведенческих тенденций человека. Указания о риске (risk-framed instructions) оказали сковывающий эффект, приводя к более консервативным решениям, но не достигая человеческой разнообразности. Добавление человеческих данных в **in-context learning** уменьшило промежуток в поведении, но не создало желаемой громадности вариативности. Эти результаты показывают, что, несмотря на успех в распознавании, LLM все еще существенно отстают в полноценной адаптации к социально-экономическим моделям. ## Значимость Наша работа может быть применена в синтетическом моделировании, особенно в социальных науках, где человеческий поведенческий аспект играет ключевую роль. Это позволяет систематически оценить, насколько LLM могут удовлетворить важные критерии воспроизведения реальности в моделях системных решений. Кроме того, наш подход может помочь улучить их доверительность в решениях, где важность человеческого

Annotation:

Large language models (LLMs) are increasingly used in social science simulations. While their performance on reasoning and optimization tasks has been extensively evaluated, less attention has been paid to their ability to simulate human decision-making's variability and adaptability. We propose a process-oriented evaluation framework with progressive interventions (Intrinsicality, Instruction, and Imitation) to examine how LLM agents adapt under different levels of external guidance and human-d...

ID: 2508.15926v1 cs.CE, cs.AI

arXiv PDF

📄 Compressing Large Language Models with PCA Without Performance Loss

2025-08-09

Авторы:

Magnus Bengtsson

Огромные языковые модели, хотя и эффективны, требуют больших ресурсов для обучения и работы, что ограничивает их применение в устройствах с ограниченными мощностями и высокими требованиями к производительности. В статье "Compressing Large Language Models with PCA Without Performance Loss" авторы рассматривают метод сжатия моделей с помощью главных компонент анализа (PCA), позволяющий сократить модели без ущерба для их качества. Авторы демонстрируют результаты этого подхода на разных задачах, включая задачу классификации MNIST, обучение трансформера на данных 20 Newsgroups и генерацию токенов с помощью transformer-декодера. Они доказывают, что PCA-сжатие позволяет сократить модели до 17% от оригинального размера, при этом сохраняя высокую точность и гранулярность. Этот подход предлагается как эффективный способ уменьшить требования ресурсов для языковых моделей без потери качества.

Annotation:

We demonstrate that Principal Component Analysis (PCA), when applied in a structured manner, either to polar-transformed images or segment-wise to token sequences, enables extreme compression of neural models without sacrificing performance. Across three case studies, we show that a one-layer classifier trained on PCA-compressed polar MNIST achieves over 98 percent accuracy using only 840 parameters. A two-layer transformer trained on 70-dimensional PCA-reduced MiniLM embeddings reaches 76.62 pe...

ID: 2508.04307v1 cs.CE, cs.AI

arXiv PDF

Показано 21 - 25 из 25 записей