📊 Статистика дайджестов
Всего дайджестов: 34022 Добавлено сегодня: 82
Последнее обновление: сегодня
Авторы:
Rufeng Chen, Shuaishuai Jiang, Jiyun Shen, AJung Moon, Lili Wei
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
The rise of Generative AI (GenAI) tools like ChatGPT has created new opportunities and challenges for computing education. Existing research has primarily focused on GenAI's ability to complete educational tasks and its impact on student performance, often overlooking its effects on knowledge gains. In this study, we investigate how GenAI assistance compares to conventional online resources in supporting knowledge gains across different proficiency levels. We conducted a controlled user experime...
📄 Cost-Efficient Long Code Translation using LLMs while Leveraging Identifier Replacements
2025-10-14Авторы:
Manojit Chakraborty, Madhusudan Ghosh, Rishabh Gupta
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
In the domain of software development, LLMs have been utilized to automate
tasks such as code translation, where source code from one programming language
is translated to another while preserving its functionality. However, LLMs
often struggle with long source codes that don't fit into the context window,
which produces inaccurate translations. To address this, we propose a novel
zero-shot code translation method that incorporates identifier replacement. By
substituting user-given long identifi...
Авторы:
Esakkivel Esakkiraja, Denis Akhiyarov, Aditya Shanmugham, Chitra Ganapathy
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Current search techniques are limited to standard RAG query-document
applications. In this paper, we propose a novel technique to expand the code
and index for predicting the required APIs, directly enabling high-quality,
end-to-end code generation for auto-completion and agentic AI applications. We
address the problem of API leaks in current code-to-code benchmark datasets by
introducing a new dataset built from real-world ServiceNow Script Includes that
capture the challenge of unclear API usa...
Авторы:
Daniele Cipollone, Egor Bogomolov, Arie van Deursen, Maliheh Izadi
Наиболее важная функция современных интегрированных сред разработки (IDE) — токен-уровневая комплиционка, которая предлагает разработчикам актуальные идентификаторы и API во время написания кода. Хотя предложения формируются с помощью статического анализа, их полезность определяется порядком их отображения. Многие нынешние системы полагаются на ручную инженерию или легкие модели машинного обучения, основанные на пользовательских логах, что ограничивает их общую наглядность и интеллектуальность.
В этой работе предложен новый подход к оценке статических комплиционок с помощью языковых моделей, реализованный в модели TreeRanker. Он организует все возможные комплиционы в префиксное дерево и выполняет один проход жадного декодирования для вычисления токен-уровневых оценок. Это позволяет достичь точного токен-уровневого ранжирования без необходимости использовать биржу поиска, манипуляции с запросами или адаптации моделей. Метод является быстрым, архитектурно независимым и взаимодействует с уже развернутыми моделями для комплиционок. Эти результаты показывают практичность и эффективность интеграции языковых моделей в существующие средства IDE, для повышения точности и отзывчивости рекомендаций.
Annotation:
Token-level code completion is one of the most critical features in modern
Integrated Development Environments (IDEs). It assists developers by suggesting
relevant identifiers and APIs during coding. While completions are typically
derived from static analysis, their usefulness depends heavily on how they are
ranked, as correct predictions buried deep in the list are rarely seen by
users. Most current systems rely on hand-crafted heuristics or lightweight
machine learning models trained on user ...