Recognition of Russian-style road signs using neural networks

Shulga Tatiana Erikovna; Solopekin Dmitrii Andreevich

doi:doi:10.24143/2072-9502-2024-2-85-94

Home / Journals / Vestnik of Astrakhan State Technical University. Series: Management, computer science and informatics / Volume 2024 Issue 2 / Recognition of Russian-style road signs using neural networks

Recognition of Russian-style road signs using neural networks

Submit manuscript Download PDF
Text

To cite

Citations:

RECOGNITION OF RUSSIAN-STYLE ROAD SIGNS USING NEURAL NETWORKS

Journal: VESTNIK OF ASTRAKHAN STATE TECHNICAL UNIVERSITY. SERIES: MANAGEMENT, COMPUTER SCIENCE AND INFORMATICS Volume 2024 № 2 , 2024

Rubrics: COMPUTER ENGINEERING AND SOFTWARE

UDK 004.89 Прикладные системы искусственного интеллекта. Интеллектуальные системы, обладающие знаниями

Shulga Tatiana Erikovna ¹

Solopekin Dmitrii Andreevich ²

Author and publication information

Authors:

1. Yuri Gagarin State Technical University of Saratov (Doctor of Physico-Mathematical Sciences, Professor; Professor of the Department of Information and Communication Systems and Software Engineering)

Russian Federation

2. Yuri Gagarin State Technical University of Saratov (Postgraduate Student of the Department of Information and Communication Systems and Software Engineering)

Russian Federation

Type:

Article

DOI:

https://doi.org/10.24143/2072-9502-2024-2-85-94

Pages:

from 85 to 95

Status:

Published

Received:

08.12.2023

Accepted:

11.04.2024

Published:

26.04.2024

Subject area:

UDK 004.89 Прикладные системы искусственного интеллекта. Интеллектуальные системы, обладающие знаниями

Language:

Russian

Keywords:

road signs, convolutional neural network, image, accuracy, YOLO architecture, test sample, predictive recognition model

Abstract and keywords

Abstract (English):
The problem of creating a model for recognizing objects in images and possible ways to solve it is considered using the example of working with Russian road signs according to ISS R 52290-2004. The analysis of methods for constructing predictive models of image recognition and existing solutions in the public domain is carried out. A convolutional neural network is used as the basic model. A road sign recognition model based on the YOLOv7 transfer network has been developed as a result of training on a dataset from the Russian RTSD road sign image database. The metrics for evaluating the quality of the created model are analyzed and described. The created model meets the quality requirements for objective metrics, allows you to make forecasts taking into account specific situations in different weather conditions and at different times of the day for 146 different predefined classes. The characteristic of the class is the number of the sign according to ISS R 52290-2004. The model has a prediction accuracy of 0.847 with a prediction completeness of 0.811. The average average prediction accuracy of the model is 0.884 when tested on 493 images from the test sample. The test sample does not overlap with the training sample, which consists of 1,842 images. The developed model is published in the public domain both for use for scientific purposes and for further further education. This provides an opportunity for researchers in this field to familiarize themselves with a practical example of the implementation of the model, to supplement or improve it if necessary. The method described in this paper will allow researchers in various subject areas to find a solution that allows them to overcome resource constraints when creating a high-performance and high-quality predictive recognition model.

Keywords:
road signs, convolutional neural network, image, accuracy, YOLO architecture, test sample, predictive recognition model

Text

Publication text (PDF): Read Download

Введение

Человеческий фактор является одной из основных причин возникновения происшествий во множестве сфер деятельности, в том числе и в области управления транспортными средствами. Полная или частичная автоматизация процессов, задействованных при исполнении повторяющихся задач, позволяет снизить или исключить описанный фактор риска из числа возможных [1]. В список существующих способов автоматизации транспортных средств можно включить как полный отказ от водителя в качестве участника транспортного процесса, так и разработку систем поддержки принятия решений, систем помощи в управлении транспортным средством. Указанные варианты систем имеют право на существование, обладая как недостатками, так и положительными сторонами [2, 3].

При разработке вышеуказанных программных решений, нацеленных на автоматизацию задач с высоким уровнем потенциального риска, в целях безопасности, стабильности и эффективности в распознавании объектов используются модели распознавания данных на изображении, построенные на базе нейросетевых технологий в совместном режиме работы с использованием лидаров, радаров и датчиков [4]. Эти модели, как правило, являются прогностическими, т. е. дают вероятностную оценку принадлежности объекта на изображении к определенному классу на основе метрик, указывая, что на изображении с определенной вероятностью находится именно этот объект в помеченной области. Этот вероятностный прогноз и является основным критерием для отнесения модели к классу прогностических.

Основным стремлением при работе с предметной областью высокого риска и значимости является достижение наибольшей точности модели в ее предсказаниях при стабильно высоком уровне уверенности модели в собственных предсказаниях. Средством к достижению цели является учет совокупности факторов, относящихся как к специфике разработки модели распознавания в целом, так и к предметной области.

В работе рассматривается предметная область – дорожные знаки – как часть домена, исследование которого необходимо для создания системы автоматизированного анализа ситуации на дорожном участке и дальнейшего на нее реагирования. Решаемая в рамках данной работы задача – построение прогностической модели распознавания дорожных знаков, действующих на территории Российской Федерации. Актуальность задачи обусловлена отсутствием моделей распознавания знаков РФ в публичном доступе, невозможностью проведения экспериментов по работе с подобными моделями, включая проведение интеграционного тестирования для создания программного средства, направленного на комплексное решение задач автоматизации анализа и реагирования на дорожном пространстве.

Анализ зарубежных исследований в данной области представляет интерес лишь для понимания принципов построения моделей распознавания, однако в общем виде не имеет практического значения при разработке модели распознавания дорожных знаков РФ ввиду значительных отличий в используемом наборе данных и их классификации. Пример зарубежного исследования приведен в статье [5], где описывается подход к созданию усовершенствованной системы помощи водителю (ADAS). В качестве компонента анализа выступает прогностическая модель распознавания дорожных знаков, построенная на наборе данных German Traffic Sign Recognition Benchmark (GTSRB). Модель обучена
с использованием группы моделей YOLO: YOLOv3 и YOLOv4-tiny. Исследователями было принято решение выполнить балансировку набора данных и уменьшения числа изображений на тестовой и обучающей выборке: с 51 900 до 30 000, с аугментацией полученных данных до 41 900. Для тестирования использовалось 12 570 изображений. В ходе обучения удалось добиться высоких значений метрик – точности accuracy 0,958, f1-меры 0,952 и точности precision 0,91. Однако проверить модель не представляется возможным, т. к. она отсутствует в публичном доступе.

Решению задачи построения прогностической модели распознавания дорожных знаков также посвящен ряд работ российских исследователей. В работах [6, 7] используется устаревший метод анализа изображений – цветовой анализ. Авторы отмечают, что «наблюдается неустойчивость к изменению погодных условий и шумов на изображении, обнаружение схожих с геометрическими фигурами не только дорожных знаков, но и других объектов» [6, c. 114]. Кроме того, анализ работ позволяет сделать вывод, что имеются проблемы с классификацией распознанных знаков. В работе [8] приведен алгоритм распознавания дорожных знаков, основанный на контурном анализе и вычислении расстояний между списками. Как отмечают авторы, алгоритм подвержен влиянию положения знака, не способен идентифицировать его, а также работает от формы – прямоугольной, треугольной, круглой, – что говорит о его низкой универсальности. При этом не определено метрик корректности отработки алгоритма. Со слов авторов, алгоритм «четко детектирует», что является субъективным суждением.

Также предпринимались попытки использовать нейросетевую модель для решения этой задачи, например, в работе исследователей Волгоградского государственного университета [9] приводится решение задачи детектирования дорожных знаков с использованием группы моделей YOLOv8, показавшей высокие результаты усредненной точности на тестовых данных – 0,98. Однако, с нашей точки зрения, этот показатель точности нельзя считать объективным, т. к. выборка данных для тестирования модели очень мала, сама выборка не является взвешенной.

Интересна работа [10] исследователей, ставящих перед собой задачу создания модели распознавания дорожных знаков. На первый взгляд, мы видим, что удалось добиться высокого показателя точности (accuracy) 0,985, однако данная метрика не выражает полноты качества модели, что видно из слов исследователей далее: «...наша модель может справляться лишь с небольшим изменением знаков, на ее работоспособность сильно влияют погодные условия, большое пространство вокруг знаков» [10, с. 1296]. Хотя выборка и представляла собой 35 000 изображений с 43 различными видами дорожных знаков, вариативность выборки мала, не учтены исключительные ситуации. Следует отметить, что исследователи явным образом не конкретизируют используемый набор данных, однако по приложенным изображениям и числовым характеристикам можно предположить, что используется набор данных GTSRB, что говорит о невозможности использования модели со знаками РФ.

Обзор предметной области

Задача распознавания дорожных знаков состоит в нахождении на изображении или видеопотоке знаков дорожного регулирования, что включает как обнаружение позиции знака, так и его классификацию.

Внутри отдельных групп дорожных знаков существует принцип систематизации в рамках распределения внутри описательных правил принадлежности отдельных знаков к конкретной предписываемой категории. Категориальное распределение различается в разных странах как в количественном, так и в качественном соотношении [11].

В работе рассматриваются дорожные знаки, действующие на территории Российской Федерации, описанные в ГОСТ Р 52290-2004 «Технические средства организации дорожного движения. Знаки дорожные. Общие технические требования» [12]. В ГОСТе перечислены требования по описанию конкретных групп знаков, выполнена их систематизация, что позволяет выделить среди них отдельные классы на основе правил регулирования [13].

Определено 8 классов разбиения дорожных знаков: предупреждающие (34 группы знаков, 45 знаков), приоритета (7 групп знаков, 13 знаков), запрещающие (33 группы знаков, 36 знаков), предписывающие (8 групп знаков, 17 знаков), особых предписаний (34 группы знаков, 55 знаков), информационные (19 групп знаков, 30 знаков), сервиса (18 групп знаков, 18 знаков), таблички (22 группы знаков, 56 знаков). Общее количество уникальных знаков – 270, не считая возможных вариаций знаков со звездочкой (множество вариантов). Каждый класс имеет внутреннюю систему разделения – группу, которая формирует подклассы. Эта система разделения представлена иерархической моделью явной классификации.

Как можно судить по рассмотренным ранее работам, важность при работе с предметной областью по дорожным знакам представляют не только внутренние, но и внешние факторы среды. Под такими факторами понимаются различие погодных условий, времени суток, качества изображений и расстояние до знаков [14].

Таким образом, определяющими факторами при работе с предметной областью являются нормативные правила описания объектов типа «дорожный знак», а также совокупность вышеупомянутых внешних факторов.

Требования к модели

При разработке прогностической модели распознавания основными требованиями к разрабатываемой модели являются возможность обработки изображений с учетом двухмерной топологии, инвариантность от масштаба изображений, скорость расчетов. Эти требования могут быть удовлетворены с использованием различных методов построения моделей.

В работе используются сверточные нейронные сети, т. к. они обладают рядом преимуществ, способствующих решению задачи построения модели распознавания дорожных знаков:

– сверточные слои позволяют модели изучать локальные пространственные признаки изображения. Для распознавания дорожных знаков важно учитывать геометрические особенности, текстуры и формы знаков, что хорошо решается с помощью сверточных операций;

– способность к автоматическому извлечению признаков: сверточные сети способны автоматически извлекать значимые признаки изображения на различных уровнях абстракции. Это позволяет модели обучаться на более высокоуровневых признаках, что повышает их способность к обобщению и распознаванию сложных паттернов;

– инвариантность к трансформациям: сверточные сети обладают инвариантностью к сдвигам, масштабированию и поворотам изображений. Это особенно важно в задаче распознавания дорожных знаков, которые могут быть представлены на изображениях в различных ракурсах и условиях освещения;

– эффективное использование параметров: сверточные сети обладают структурой, которая позволяет эффективно использовать параметры модели, что делает их относительно компактными по сравнению с полносвязными нейронными сетями.

Как результат, применение сверточных нейронных сетей для задачи распознавания дорожных знаков позволяет создавать модели, способные эффективно работать с изображениями, извлекать признаки и классифицировать знаки даже в условиях изменчивости и шума.

Фундаментальные принципы, которые используются в архитектуре сверточных нейронных сетей, это свертка и субдискретизация. Эти операции выполняются последовательно и позволяют выделить более высокоуровневые признаки из базовых данных.

Свертка подразумевает поэлементное умножение фрагментов исходных данных на ядро свертки, которое представляет собой матрицу, и последующее суммирование. Таким образом, получается карта признаков. Эту операцию можно также интерпретировать как поиск характеристических признаков, которые затем используются для построения матрицы свертки. При использовании ядер свертки как обучающих параметров выходы из предыдущего слоя образуют сверточный слой. Количество таких слоев в сети может быть разным, в зависимости от конкретной архитектуры сети.

Операция субдискретизации, или пулинга, производится после свертки и используется для уменьшения размеров сформированных карт признаков. При пулинге задействуется либо функция максимума, либо взвешенного среднего. Таким образом формируется пулинговый слой, на основе которого можно достичь инвариантности от масштаба исходных данных, более высокой скорости расчетов.

Сеть состоит из нейронов, обладающих своими весами и смещениями, набором входных данных. Формирование полносвязного слоя основано на том, что каждый нейрон в данном слое имеет полные связи с нейронами в предыдущем слое, принимая входные данные и выдавая выходные данные. При этом выходы нейронов с предыдущего слоя связаны со входами нейронов с текущего слоя, а выходы текущего передаются следующему слою [15].

Исходя из особенностей архитектуры и специфики ее построения, можно считать, что сверточная нейронная сеть удовлетворяет требованиям рассматриваемой задачи построения прогностической модели: при работе со сверточной сетью учитывается двухмерная топология изображений, сеть устойчива к смещениям, изменениям масштаба и поворотам объектов.

Определение подхода при создании модели распознавания

По результатам анализа подходов к решению задачи распознавания объектов на изображении был выбран метод реализации модели на основании сверточной нейронной сети, предобученной на некотором множестве изображений. Такой тип сверточных сетей принято называть трансферными. Данный метод позволяет значительно сократить время разработки модели без потерь точности, а также осуществить разработку модели при недостаточном количестве машинных ресурсов [16].

Один из подходов, базирующихся на сверточных нейронных сетях, состоит в использовании канонических изображений классов в качестве ядра. Эти ядра необходимо обнаружить на изображении путем применения скользящего окна: изображение разделяется на квадратные фрагменты – ограничивающие рамки, содержимое которых передается как входные данные. В процессе обработки фрагмент перемещается по изображению, занимая все возможные положения на дискретной плоскости. Вместо использования шаблона можно применять обученный классификатор, но для достижения лучших результатов требуется перебор всех ограничивающих рамок с применением порога уверенности в правильной классификации. Это важно, потому что объекты могут быть разного масштаба и находиться в разных частях изображений. Использование подхода влечет неэффективный полный перебор всех рамок.

Чтобы избежать полного перебора, применяются два параллельно развивающихся подхода: двухэтапные и одноэтапные методы [17]. Принципиальное отличие между ними заключается в том, что в двухэтапных методах используется дополнительный алгоритм генерации регионов – точек интереса, – позволяющий добиться высокой точности. Однако эти методы уступают в значительной мере по скорости одноэтапным методам, что критично для решения задач управления беспилотным автомобилем, распознавания дорожных знаков и им подобным. Популярные представители семейства методов: YOLO [17] и SSD [18].

После проведенного анализа существующих решений определен ряд работ с похожей спецификой, использующих группу моделей YOLO как базу для обучения собственных моделей, например работа [9].

Выбор группы моделей YOLO для решения задачи распознавания дорожных знаков продиктован целями данной задачи, решаемыми благодаря преимуществам указанных моделей: YOLO архитектура изначально разработана для быстрой и эффективной работы на больших наборах данных. Это важно в контексте распознавания дорожных знаков, где скорость работы модели играет ключевую роль для обеспечения безопасности на дороге, в том числе при внедрении созданной модели в ADAS. Архитектура YOLO позволяет находить и классифицировать одновременно несколько объектов на изображении. Дорожные знаки могут принадлежать к разным классам, и применение YOLO позволяет точно определять каждый из них. Архитектура YOLO демонстрирует хорошую точность при работе с изображениями различного качества и условиями освещения, что важно при работе в различных погодных условиях и в различное время суток. Архитектура YOLO имеет много конфигурационных параметров, которые можно настроить под конкретную задачу распознавания дорожных знаков, что делает эту архитектуру очень гибкой и адаптивной.

Метрики валидации модели

Для оценки качества модели необходимо выбрать набор метрик. Выбор должен осуществляться с учетом установленных показателей и требований к модели, определенных на этапе проектирования. К метрикам оценки качества создаваемой модели распознавания относятся:

– полнота предсказаний (отношение числа истинно положительных решений TP к общему количеству решений, включая ложно отрицательные решения FN):

;

– точность предсказаний (отношение числа истинно положительных решений к общему количеству решений, включая ложно положительные решения FP):

– F1-мера (гармоническое среднее между точностью и полнотой, отношение площадей ограничивающих рамок – IoU, измеряет перекрытие между двумя границами – предсказанной моделью и объявленной изначально):

– усредненная точность (рассчитывается как среднее значение средней точности (AP) по всем классам и/или общих пороговых значений IoU в зависимости от определенных задач распознавания):

Заметим, что несмотря на то, что данные метрики описаны в литературе по распознаванию изображений, далеко не во всех исследованиях (например, упомянутых во введении статьи) они используются авторами, что не позволяет получить полного представления о качестве модели.

Эксперименты, проводимые с разрабатываемой моделью, подтвердили достоверность показаний метрик и их общую достаточность в определении качества модели: в первичных экспериментах проведено обучение модели на ранней версии YOLOv6, обучение проводилось на 1 842 изображениях на обучающей выборке и 493 на тестовой выборке. Была произведена объективная оценка на валидирующем наборе, итоговый результат обученной на 35 эпохах модели показал следующие значения метрик: mAP@.5 – 0,668; precision – 0,612. Обучение на модели YOLOv6 за 35 эпох показало худший результат: mAP@.5 – 0,385; precision – 0,42.

Анализ оценки моделей из смежных предметных областей для решения типовой задачи (например, [19, 20]) также показал объективность использования выбранных метрик: согласно исследованию, приведенному в работе [19], удалось оценить полученную модель как надежный детектор и утвердить ее использование с учетом приведенных метрик.

Специфика работы с наборами данных

Чтобы оценить объективность разрабатываемой модели с использованием выбранного подхода, следует учитывать не только показания метрик, но и специфику подбора набора данных. Описывая показатели точности предсказанной модели, полноту ее предсказаний в выставлении оценки качества прогностической модели, необходимо учитывать, что опорой в выставлении оценки служит тестовая выборка данных. Таким образом, объективно оценить две разные модели можно только обладая единым набором данных для теста, иначе показатели можно свести к условно высоким при сужении набора тестовых данных и их усреднении. Для вынесения объективной оценки по качеству модели набор данных должен отвечать определенным правилам и критериям: качество изображений, соответствие изображений стандартизованному снимку или же элементу видеопотока, наличие исключительных ситуаций, его полнота и объективность, подтвержденные исследователями данных.

Для реализации модели распознавания дорожных знаков был выбран набор данных RTSD [21], который предназначен для качественного обучения и тестирования алгоритмов распознавания дорожных знаков. Этот набор разработан исследовательской командой в составе А. Конушина и В. Шахуро для решения ряда задач: уменьшить количество ложных срабатываний прогностических моделей при их обучении и дальнейшей работе, повысить точность распознавания моделей [21].

Набор данных RTSD содержит 179 138 кадров с 104 358 изображениями знаков. Общее количество уникальных знаков – 156 [21]. Согласно анализу, проведенному авторами статьи [21], набор данных превосходит другие публичные базы дорожных знаков по множеству характеристик, включая количество кадров, физических знаков, классов знаков, их изображений. Немаловажным преимуществом набора данных является наличие в нем изображений знаков в разное время суток, года, в разных погодных условиях.

За основу при составлении обучающей и тестовой выборки взято публичное представление набора RTSD, предназначенное для задачи обнаружения [22]. Набор содержит 47 639 изображений с 80 277 знаками в тренировочной выборке и 11 389 изображений с 25 232 знаками в тестовой выборке.

Для осуществления возможности проведения множества экспериментов по сборке модели было решено сузить набор до 1 842 изображений на обучающей выборке и 493 на тестовой выборке путем взвешенного отбора знаков всего набора путем исключения условно повторяющихся изображений одного участка. Общее число классов составило 146. Полученный набор классов представлен на рис. 1.

Рис. 1. Набор классов обучающей выборки

Fig. 1. A set of training sample classes

Модель распознавания дорожных знаков российского образца

Как упоминалось выше, основным инструментом для создания модели выбрана модель из семейства YOLO – YOLOv7. Базовые модели семейства YOLO обучались на наборе данных MS COCO, составляющем 330 000 изображений с более чем 1,5 млн размеченных объектов.

Поскольку элементы группы моделей YOLOv7 являются трансферными моделями, сама модель в процессе обучения не претерпевает кардинальных изменений: она сохраняет свою общую структуру и архитектуру, но ее параметры настраиваются на основе новых данных и новой задачи. Этот процесс позволяет модели быстро адаптироваться к новым сценариям и улучшать свою способность к распознаванию и классификации объектов.

Архитектура группы моделей YOLOv7 [19] приведена на рис. 2.

Рис. 2. Архитектура группы моделей YOLOv7

Fig. 2. The architecture of the YOLOv7 model group

Для обучения нейронной сети на основе YOLOv7 данные были разделены в соответствии с описанием структуры тестового и обучающего набора данных YOLOv7. Среди семейства сверточных моделей YOLOv7 для дальнейшего дообучения требованиям задачи отвечают две: YOLOv7 и YOLOv7-tiny, т. к. позволяют быстро и с высокой точностью распознавать объекты на изображении согласно документации YOLOv7.

YOLOv7 – это полноразмерная модель, которая обладает большим количеством слоев и параметров. Она предназначена для высокоточного обнаружения объектов, но требует больше вычислительных ресурсов и памяти. YOLOv7-tiny является уменьшенной версией модели. Она имеет меньше слоев и параметров, что делает ее более легкой и быстрой, но менее точной в сравнении с YOLOv7. YOLOv7-tiny предоставляет баланс между скоростью обработки и точностью обнаружения [19].

В архитектуре моделей учитывается 31 указанный в явном виде гиперпараметр. Был осуществлен подбор наиболее важных гиперпараметров: momentum и weight_decay, отвечающих за изменение скорости и параметров модели, установленных в значении 0,936 и 0,00055 соответственно; learning rate – lr0 и lrf, отвечающих за скорость обучения, адаптации модели к новым данным, установлены в 0,01 и 0,2 соответственно. Произведено изменение размера изображения до 1 920 × 1 080 в случае несоответствия заданному размеру. Проведенные эксперименты показали, что увеличение размера изображения приводит к улучшению качества модели, но существенно увеличивает время обучения. В YOLOv7 имеются автоматические методы оптимизации для упрощения подбора гиперпараметров.

Проведен анализ результатов обучения базовых моделей YOLOv7 и YOLOv7-tiny. Анализ проводился на промежуточных этапах каждые 50 эпох, а также общий анализ после 250 эпох. Лучший результат за меньшее время получен с использованием модели YOLOv7-tiny (mAP@.5 – 0,393 за 0,93 ч по сравнению с mAP@.5 – 0,339 при обучении модели YOLOv7 в течение 3 ч), поэтому было принято решение выбрать модель YOLOv7-tiny.

Процесс дальнейшего дообучения и выход на плато обучения позволил получить модель, которая удовлетворяет требованиям качества согласно определенным метрикам: усредненная точность mAP@.5 – 0,884; точность предсказаний precision – 0,847.

Согласно матрице ошибок, представленной на рис. 3, число ячеек, отклоняющихся от главной диагонали, незначительно, что также свидетельствует о корректности модели.

Рис. 3. Матрица ошибок для созданной модели

Fig. 3. Error matrix for the created model

Таким образом, процесс создания модели состоял из следующих этапов: загрузка предварительно обученной модели, подбор гиперпараметров, обучение на пользовательском наборе данных, оценка и настройка модели, дообучение.

Модель была протестирована на тестовых данных, полученных из сети. Визуальный анализ показал, что распознавание объектов на изображениях и классификация дорожных знаков проводятся корректно. Корректны как обозначение рамки, так и обозначение класса знака. Пример вывода предсказаний сформированной модели представлен на рис. 4 (на фотографии найдены знаки и указаны коды их классов согласно ГОСТ Р 52290-2004).

Рис. 4. Пример работы модели

Fig. 4. An example of how the model works

Разработанная модель (набор весов) выложена на облачном сервисе drive [23]. Это позволит использовать ее исследователям в области создания моделей распознавания.

Заключение

Разработана модель в виде сверточной нейронной сети для распознавания дорожных знаков, способная выделять и классифицировать знаки российского образца в видеопотоке или на статичных изображениях, отличающаяся от известного высоким уровнем точности на объемной тестовой выборке. Особенности обучения и тестирования модели позволяют утверждать, что модель распознает знаки в разное время года, суток и в разных погодных условиях.

Модель можно использовать в экспериментальном программном комплексе, нацеленном на создание беспилотного средства, системы помощи водителю. У модели имеются перспективы развития, в том числе в направлении улучшения точности.

Разработанная прогностическая модель может послужить опытным образцом для проведения первых экспериментов по обучению и валидации прогностической модели для начинающих исследователей в области распознавания российских дорожных знаков.

References

1. Iurin I. V., Lebedev G. V., Livshits I. I. Perspektivy ispol'zovaniia bezekipazhnykh transportnykh sudov v moriakh arkticheskogo basseina Rossii [Prospects for the use of unmanned transport vessels in the seas of the Arctic basin of Russia]. Nauchno-tekhnicheskii vestnik informatsionnykh tekhnologii, mekhaniki i optiki, 2021, no. 1, pp. 73-84.

2. Dremliuga R. I., Kripakova A. V., Iakovenko A. A. Regulirovanie testirovaniia i ispol'zovaniia bespilotnogo avtotransporta: opyt SShA [Regulation of testing and use of self-driving vehicles: the US experience]. Zhurnal zarubezhnogo zakonodatel'stva i sravnitel'nogo pravovedeniia, 2020, no. 3, pp. 68-85.

3. Korotkova Iu. A. Osobennosti vospriiatiia informatsii voditelem vysokoavtomatizirovannogo transportnogo sredstva [Features of information perception by the driver of a highly automated vehicle]. Bezopasnost' dorozhnogo dvizheniia, 2022, no. 3, pp. 48-51.

4. Akat'ev Ia. A., Latypov A. R. Analiz osobennostei algoritmov mashinnogo obucheniia v avtomatizirovannykh sistemakh vozhdeniia [Analysis of the features of machine learning algorithms in automated driving systems]. E-Scio, 2022, no. 1 (64), pp. 641-655.

5. Kshitij Dhawan, Srinivasa Perumal R., Nadesh R. K. Identification of traffic signs for advanced driving assistance systems in smart cities using deep learning. Multimedia Tools and Applications, 2023, vol. 82, pp. 26465-26480.

6. Enokaev R. M. Algoritm raspoznavaniia dorozhnykh znakov [The algorithm for recognizing road signs]. Prikladnaia matematika: sovremennye problemy matematiki, informatiki i modelirovaniia, 2020, no. 2, pp. 113-117.

7. Gil'manov T. A. Sistema raspoznavaniia dorozhnykh znakov [Road sign recognition system]. Science Time, 2014, no. 8 (8), pp. 80-85.

8. Medvedev M. V., Kirpichnikov A. P., Sinichkina T. A. Detektirovanie dorozhnykh znakov pri pomoshchi komp'iuternogo zreniia [Detection of road signs using computer vision]. Vestnik Kazanskogo tekhnologicheskogo universiteta, 2016, vol. 19, no. 18, pp. 143-147.

9. Nikitin D. V., Taranenko I. S., Kataev A. V. Detektirovanie dorozhnykh znakov na osnove neirosetevoi modeli YOLO [Detection of road signs based on the YOLO neural network model]. Inzhenernyi vestnik Dona, 2023, no. 7 (103), pp. 91-99.

10. Stakheeva A. A., Krainikov A. N., Viatkin D. A. Raspoznavanie dorozhnykh znakov s ispol'zovaniem svertochnoi neironnoi seti [Recognition of road signs using a convolutional neural network]. Mezhdunarodnyi zhurnal prikladnykh nauk i tekhnologii «Integral», 2023, no. 4, pp. 1277-1300.

11. Kuznetsova A. P. Istoriia dorozhnykh znakov [The history of road signs]. SAPR i GIS avtomobil'nykh dorog, 2014, no. 1 (2), pp. 99-104.

12. GOST R 52290-2004. Tekhnicheskie sredstva organizatsii dorozhnogo dvizheniia. Znaki dorozhnye. Obshchie tekhnicheskie trebovaniia [ISS R 52290-2004. Technical means of traffic management. Road signs. General technical requirements]. Moscow, Standartinform Publ., 2006. 126 p.

13. Krivopalov A. D., Skvortsov A. V., Petrenko D. A. Ispol'zovanie razlichnykh standartov pri opisanii dorozhnykh dannykh v programmnykh produktakh «IndorSoft» [The use of various standards in the description of road data in IndorSoft software products]. SAPR i GIS avtomobil'nykh dorog, 2014, no. 1 (2), pp. 87-89.

14. Kharchenko I. K., Borovskoi I. G., Shel'mina E. A. Ispol'zovanie ansamblia svertochnykh neironnykh setei dlia raspoznavaniia dorozhnykh znakov [Using an ensemble of convolutional neural networks to recognize road signs]. Vestnik Tomskogo gosudarstvennogo universiteta. Upravlenie, vychislitel'naia tekhnika i informatika, 2022, no. 61, pp. 88-96.

15. Nikolenko S., Kadurin A., Arkhangel'skaia E. Glubokoe obuchenie. Pogruzhenie v mir neironnykh setei [Deep learning. Diving into the world of neural networks]. Saint Petersburg, Piter Publ., 2018. 480 p.

16. Alekseev P., Kviatkovskaia I. Iu. Primenenie nei-ronnykh setei dlia raspoznavaniia printsipial'nykh uslovno-graficheskikh elektricheskikh oboznachenii [Application of neural networks for recognition of basic conditionally graphical electrical designations]. Vestnik Astrakhanskogo gosudarstvennogo tekhnicheskogo universiteta. Seriia: Upravlenie, vychislitel'naia tekhnika i informatika, 2021, no. 2, pp. 47-56.

17. Andriianov N. A., Dement'ev V. E., Tashlinskii A. G. Obnaruzhenie ob"ektov na izobrazhenii: ot kriteriev Baiesa i Neimana – Pirsona k detektoram na baze neironnykh setei EfficientDet [Object detection in an image: from Bayes and Neumann–Pearson criteria to detectors based on EfficientDet neural networks]. Komp'iuternaia optika, 2022, vol. 46, no. 1, pp. 139-159.

18. Wei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu, Alexander C. Berg SSD: Single Shot MultiBox Detector. Computer Vision and Pattern Recognition. Available at: https://arxiv.org/abs/1512.02325 (accessed: 26.09.2023).

19. Chien-Yao Wang, Bochkovskiy A., Hong-Yuan Mark Liao. YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors. Computer Vision and Pattern Recognition. Available at: https://arxiv.org/abs/2207.02696 (accessed: 27.09.2023).

20. Bolkhovitina E. I. Issledovanie modelei svertochnykh neironnykh setei YOLOv3 i retinanet dlia zadachi detektirovaniia litsa cheloveka na izobrazhenii [Investigation of YOLOv3 and retinanet convolutional neural network models for the task of detecting a person's face in an image]. StudNet, 2022, vol. 5, no. 6, pp. 5439-5448.

21. Shakhuro V. I., Konushin A. S. Rossiiskaia baza izobrazhenii avtodorozhnykh znakov [Russian database of images of road signs]. Komp'iuternaia optika, 2016, vol. 40, no. 2, pp. 294-300. DOI:https://doi.org/10.18287/2412-6179-2016-40-2-294-300.

22. Konushin A. S. Nabor dannykh RTSD [The RTSD dataset]. Available at: https://graphics.cs.msu.ru/projects/traffic-sign-recognition.html (accessed: 05.09.2023).

23. Solopekin D. A. Vesa luchshei modeli [Weights of the best model]. Available at: https://drive.google.com/file/d/1xmHbaJ6vW6-dgrhss_tZH7lFrrrbyY3Y/view?usp=sharing (accessed: 13.10.2023).

This work is licensed under Creative Commons Attribution 3.0 Unported

Submit manuscript Download PDF
Text

To cite

Citations:

Confirmation

Регистрация