Investigation on deep learning-based galaxy image translation models
2508.03291v1
astro-ph.IM, astro-ph.GA, cs.CV
2025-08-09
Авторы:
Hengxin Ruan, Qiufan Lin, Shupei Chen, Yang Wang, Wei Zhang
Резюме на русском
**Резюме**
Обработка изображений галактик через глубокие нейросетевые модели является ключевым элементом в астрофизике и космологии. Несмотря на развитие генеративных моделей для перевода изображений галактик, большинство исследований ограничиваются пиксельными и морфологическими характеристиками, при этом недостаточно уделяется внимания сохранению высокоординальной физической информации, такой как спектроскопический краснодвижевый зазубр. В данном исследовании проверена эффективность генеративных моделей в сохранении такой информации, одновременно с пиксельными и морфологическими статистиками. Использовались модели Swin Transformer, SRGAN, каспсульная сеть и модель размывания, а также данные из SDSS и CFHTLS. Оказалось, что модели демонстрируют различные уровни несостоятельности в сохранении краснодвижевой информации, даже если глобальные структуры и морфологические статистики могут быть приблизительно воспроизведены. Особенно заметны неточности в переводе кросс-бандных максимумов потока, что связано с многим-к-многим природой моделирования. Тем не менее, даже недостаточно точно переведенные изображения могут содержать значительные данные и быть полезными для задач, где высокая точность изображений не является критичной. Результаты работы могут способствовать развитию моделей для галактического перевода изображений с учетом физических свойств.
Abstract
Galaxy image translation is an important application in galaxy physics and
cosmology. With deep learning-based generative models, image translation has
been performed for image generation, data quality enhancement, information
extraction, and generalized for other tasks such as deblending and anomaly
detection. However, most endeavors on image translation primarily focus on the
pixel-level and morphology-level statistics of galaxy images. There is a lack
of discussion on the preservation of complex high-order galaxy physical
information, which would be more challenging but crucial for studies that rely
on high-fidelity image translation. Therefore, we investigated the
effectiveness of generative models in preserving high-order physical
information (represented by spectroscopic redshift) along with pixel-level and
morphology-level information. We tested four representative models, i.e. a Swin
Transformer, an SRGAN, a capsule network, and a diffusion model, using the SDSS
and CFHTLS galaxy images. We found that these models show different levels of
incapabilities in retaining redshift information, even if the global structures
of galaxies and morphology-level statistics can be roughly reproduced. In
particular, the cross-band peak fluxes of galaxies were found to contain
meaningful redshift information, whereas they are subject to noticeable
uncertainties in the translation of images, which may substantially be due to
the nature of many-to-many mapping. Nonetheless, imperfect translated images
may still contain a considerable amount of information and thus hold promise
for downstream applications for which high image fidelity is not strongly
required. Our work can facilitate further research on how complex physical
information is manifested on galaxy images, and it provides implications on the
development of image translation models for scientific use.