Mechanical Automation with Vision: A Design for Rubik's Cube Solver

2508.12469v1 cs.RO, cs.CV 2025-08-20
Авторы:

Abhinav Chalise, Nimesh Gopal Pradhan, Nishan Khanal, Prashant Raj Bista, Dinesh Baniya Kshatri

Резюме на русском

## Контекст Исследование посвящено развитию системы автоматизированного решения головоломки Рубика (Rubik's Cube) с использованием механической автоматизации и визуального распознавания. Основным применением является развитие устройств, обладающих навыками решения головоломок для развлечений, исследований или использования в машинном обучении. Существующие решения часто сложноверсты и требуют дорогостоящих компонентов. Также существует проблема неэффективности и неточности в решении головоломки с использованием существующих алгоритмов и аппаратных решений. Мотивацией для этого исследования является разработка более доступной, точной и эффективной системы решения головоломки, использующей механическую автоматизацию и визуальное распознавание. ## Метод Система состоит из нескольких ключевых компонентов. Механическая система использует три шаговых двигателя для физического манипулирования головоломки. Микроконтроллер обеспечивает управление этими двигателями и взаимодействие с остальными компонентами. Для распознавания состояния головоломки в реальном времени используется камера и модель распознавания YOLOv8 с прецизионным показателем 0.98443, рекуррентностью 0.98419, потерями по границам 0.42051 и классам 0.2611. Решение головоломки осуществляется с помощью Kociemba’s algorithm, ализационная часть разрабатывается на Unity. Это позволяет системе преобразовывать визуальную съемку в действия и решение головоломки. ## Результаты В ходе экспериментов система продемонстрировала среднее время решения головоломки ~2.2 минут. Алгоритм YOLOv8 оказался очень точным при распознавании состояний головоломки, что позволило системе эффективно визуализировать ин INITIAL STATE. Шаговые двигатели и микроконтроллер обеспечивают гладкий и точный физический манипулирование головоломкой. В целом, система проявила высокую эффективность и доступность, но время решения еще может быть улучшено. ## Значимость Система может быть применена в различных областях, таких как развлекательные технологии, обучение и исследования в области машинного обучения. Основное преимущество — это доступность, модульность и точность решения головоломки в реальном времени. Благодаря использованию YOLOv8, система обеспечивает высокую точность в распознавании состояний головоломки. Это может быть использовано для развития автоматизированных решений в разнообразных областях, таких как игровая индустрия, обучение алгоритмам восприятия и распознавания объектов. ## Выводы Основные достижения включают разра

Abstract

The core mechanical system is built around three stepper motors for physical manipulation, a microcontroller for hardware control, a camera and YOLO detection model for real-time cube state detection. A significant software component is the development of a user-friendly graphical user interface (GUI) designed in Unity. The initial state after detection from real-time YOLOv8 model (Precision 0.98443, Recall 0.98419, Box Loss 0.42051, Class Loss 0.2611) is virtualized on GUI. To get the solution, the system employs the Kociemba's algorithm while physical manipulation with a single degree of freedom is done by combination of stepper motors' interaction with the cube achieving the average solving time of ~2.2 minutes.

Ссылки и действия