📊 Статистика дайджестов
Всего дайджестов: 34022 Добавлено сегодня: 82
Последнее обновление: сегодня
Авторы:
Zilong Cao, Hai Zhang
## Контекст
Область данных исследований посвящена улучшению различных методов работы с данными, которые используются в различных областях, включая медицину, финансы и анализ данных. Одной из важных областей является развитие методов, обеспечивающих гарантии конфиденциальности данных, чтобы защитить пользователей и информацию. Одна из проблем в этой области состоит в том, что традиционные методы работы с конфиденциальными данными, такие как методы работы с линейной регрессией, часто неэффективны из-за необходимости добавлять шум, что приводит к ухудшению точности и результатов. Из-за этой проблемы нужны новые подходы для улучшения того, как линейная регрессия работает в сценариях, где данные должны быть защищены.
## Метод
Методология, представленная в этой работе, основывается на идее использования публичной информации для повышения точности метода работы с конфиденциальными данными. Авторы предлагают новый подход, в котором используется матрица второго момента, полученная из публичных данных, для преобразования исходных данных. Это позволяет уменьшить влияние шума, добавленного для защиты конфиденциальности. Результат этой преобразования — улучшенная модель линейной регрессии, которая может давать более точные и надежные результаты. Архитектура метода заключается в преобразовании данных с помощью публичной матрицы второго момента, а затем применение этой модели к защищенным данным.
## Результаты
В ходе экспериментов над синтетическими и реальными данными показано, что предлагаемый подход дает значительное улучшение точности и устойчивости результатов в сравнении с традиционным методом работы с линейной регрессией. Данные, использованные в экспериментах, позволили подтвердить, что преобразование данных с помощью публичной матрицы второго момента действительно улучшает условия решения задачи, уменьшает влияние шума и улучшает точность регрессионной модели. Также были получены теоретические оценки точности и устойчивости нового метода, которые подтверждают пользу этого подхода по сравнению с существующими.
## Значимость
Предлагаемый подход имеет широкие применения в областях, где требуется обеспечение конфиденциальности данных, такие как медицина, финансы и исследования. Одним из преимуществ является улучшение точности и надежности результатов, а также уменьшение влияния шума, добавляемого для защиты конфиденциальности. Это может привести к повышению качества решений в сферах, где требуется быстрый и точный анализ данных. Также, этот подход может иметь потенциал для распространения в других областях, где защита конф
Annotation:
Leveraging information from public data has become increasingly crucial in
enhancing the utility of differentially private (DP) methods. Traditional DP
approaches often require adding noise based solely on private data, which can
significantly degrade utility. In this paper, we address this limitation in the
context of the ordinary least squares estimator (OLSE) of linear regression
based on sufficient statistics perturbation (SSP) under the unbounded data
assumption. We propose a novel method t...
Авторы:
Ricardo Diaz-Rincon, Muxuan Liang, Adolfo Ramirez-Zamora, Benjamin Shickel
## Контекст
Parkinson's Disease (PD) является хронической неврологической заболеванием, протекающим с выраженной индивидуальной течением. Одной из сложных задач в его лечении является корректное управление леводопиной дозировкой, которая требует учета индивидуального течения заболевания и ответа на лечение. Невралы должны сбалансировать контроль симптомов с оптимальной дозировкой дапаминергических препаратов, минимизируя стоимость побочных эффектов. Недостаточная или абрупная корректировка дозы может вызвать такие проблемы, как дискинезия, опоздание и невропсихические отклонения, существенно снижая качество жизни пациента. Текущие подходы к решению этой задачи основываются на творческом опыте и переживании, не имеют систематизированной методологии. Машинное обучение, несмотря на его прогресс, в свою очередь, сталкивается с проблемой недоверия клиников, так как показывает только точные предсказания без учета их неопределенности. Это ограничивает пользующиеся методом клинических решений. Необходимо разработать метод, который не только предскажет необходимую дозу, но и при этом даст статистически обоснованные интервалы доверия.
## Метод
Мы разработали два-этапный подход, основанный на конformal prediction, для прогноза необходимости леводопины до 2 лет вперёд. Этап первый выявляет пациентов, которым может понадобиться корректировка лечения, а второй этап прогнозирует значение леводопинынго эквивалентного ежедневного дозировки (LEVD). Мы использовали данные электронных медицинских рекордов 631 пациентов с PD, наблюдавшихся в University of Florida Health в период 2011–2021 годов. Необходимость учитывать несимметричный распределение данных (zero-inflation) привела к разработке специальных мер, чтобы гарантировать качество прогнозов при таких условиях. Особенностью нашего подхода является учет неопределенности, что позволяет клиникам принимать более обоснованные решения о корректировке лечения.
## Результаты
Мы получили значительные результаты в области прогнозирования необходимости корректировки леводопины дозы. Наша модель демонстрирует высокую точность при сохранении доверительных интервалов, которые значительно короче, чем в традиционных подходах. Это позволяет предсказывать необходимые корректировки на короткие сроки с высокой точностью и для долгосрочных прогнозов — более широкие интервалы. Экспериментальные результаты показали, что наш алгоритм сохраняет статистически значимый уровень доверия к прогнозам, что значительно улучшает надежность решений клиников.
## Значимость
Предлагаемый подход может быть применён в клинической практике для оптимизации лечения
Annotation:
Parkinson's Disease (PD) medication management presents unique challenges due
to heterogeneous disease progression and treatment response. Neurologists must
balance symptom control with optimal dopaminergic dosing based on functional
disability while minimizing side effects. This balance is crucial as inadequate
or abrupt changes can cause levodopa-induced dyskinesia, wearing off, and
neuropsychiatric effects, significantly reducing quality of life. Current
approaches rely on trial-and-error dec...
Авторы:
Muralikrishnna G. Sethuraman, Faramarz Fekri
## Контекст
Вопрос изучения закономерностей, взаимосвязей и причинных связей между переменными широко распространен в науке и применяется в различных областях, таких как биология, экономика и информатика. Однако, многие методы, используемые в качестве средств для выявления таких связей, приходят к некоторым ограничениям. Они часто работают с предположениями об отсутствии неизмеренных конфундеров (неизмеренных переменных, влияющих на основные переменные) или с предположением того, что граф причинных связей является ациклическим. Недостатком таких подходов является то, что в реальных системах, таких как биологические сети, эти предположения часто не выполняются. Изложенная проблема поощряет развитие методов, которые могут обнаруживать системные связи в нерегулярных условиях, в том числе при неизмеренных конфундерах.
## Метод
Мы предлагаем DCCD-CONF, новую разностительную рамку для выявления циклических причинных связей в системах с неизмеренными конфундерами с использованием вмешательствных данных. Рамка основывается на дифференцируемой оптимизации, которая позволяет изменять структуру графа и оценивать распределение конфундеров. Мы используем лог-ликейл-функцию для максимизации вероятности данных и альтернативные шаги для оптимизации структуры графа и оценки конфундеров. Это позволяет нашему подходу гибко работать с нелинейными связями и сложным данным.
## Результаты
Мы проверили DCCD-CONF на синтетических данных и на реальных данных по изменению генов. Наши эксперименты показали, что DCCD-CONF превосходит существующие методы как в восстановлении структуры графа, так и в выявлении конфундеров. Эта система показала высокую точность в обнаружении циклических связей и позволяет выделять значимые связи даже в системах с неизмеренными конфундерами.
## Значимость
Наш подход может применяться в различных научных областях, включая биологию сетей, экономические модели и машинное обучение. Он предоставляет более точные средства для визуализации причинных связей и выявления взаимосвязей, даже в сложных системах. Благодаря его гибкости и соответствию теоретическим гарантиям, DCCD-CONF может стать ключевым инструментом для развития теории и практики выявления причинных связей.
## Выводы
Мы предлагаем DCCD-CONF как мощный подход к выявлению циклических причинных связей в сложных системах, в том числе при наличии неизмеренных конфундеров. Наши результаты показали, что этот метод превосходит существующие подходы в точности и гибкости. Мы также подтвердили теоретическое свойство нашего подхо
Annotation:
Understanding causal relationships between variables is fundamental across
scientific disciplines. Most causal discovery algorithms rely on two key
assumptions: (i) all variables are observed, and (ii) the underlying causal
graph is acyclic. While these assumptions simplify theoretical analysis, they
are often violated in real-world systems, such as biological networks. Existing
methods that account for confounders either assume linearity or struggle with
scalability. To address these limitation...
Показано 11 -
13
из 13 записей