XIV Міжнародна наукова інтернет-конференція ADVANCED TECHNOLOGIES OF SCIENCE AND EDUCATION (19-21.04.2018)

Русский English




Научные конференции Наукові конференції

к.т.н., Кормановський С.І., Богуто Д.Г., Ордіховський В.О. КОДУВАННЯ КОНТУРУ ТА КЛАСИФІКАЦІЯ ДИНАМІЧНИХ ЗОБРАЖЕНЬ ДЛЯ ЗАДАЧ РОЗПІЗНАВАННЯ

к.т.н., Кормановський С. І.

Винницький національний технічний університет,

Богуто Д. Г. 

Київський національний університет культури і мистецтв,  

Ордіховський В. О.

Вінницький національний аграрний університет

КОДУВАННЯ КОНТУРУ ТА КЛАСИФІКАЦІЯ ДИНАМІЧНИХ ЗОБРАЖЕНЬ ДЛЯ ЗАДАЧ РОЗПІЗНАВАННЯ

Важливою задачею розпізнавання зображень є їх якісний опис, тобто створення такої моделі зображення, яка б дозволила ефективно представити об'єкт розпізнавання та однозначно зіставити це представлення з набором еталонних класів зображень, оскільки якість опису зображень безпосередньо впливає як на алгоритм розпізнавання, так і на конкретну його апаратну реалізацію.

Основним напрямком у створенні штучного інтелекту є розпізнавання різних динамічних об'єктів шляхом аналізу їхніх зображень. Оскільки зображення несуть у собі великий обсяг інформації, то виникають такі важливі питання, як їхнє представлення і класифікація. Велику частину інформації про зображення несуть його геометричні характеристики, у зв'язку з тим, що зображення представляє геометричну модель об'єкта. У реальному світі існує багато динамічних об'єктів, що можуть бути представлені силуетними зображеннями, контур яких нагадує форму плями. Головна задача полягає в тому, щоб створити таку модель плямоподібного зображення, по якій можна буде легко ідентифікувати об'єкт і сортувати його.

Метод ланцюгового кодування контуру в полярній сістемі координат.

Головна мета розпізнавання зображень полягає в одержанні їхнього опису і зіставлення цих описів з моделями класів зображень. Коли існують компактні описи моделей зображень, що описують класи зображень, то  зображення, яке аналізується, буде відноситися до такого класу, для якого можна встановити відповідність між описами зображення і моделі.

Задачі розпізнавання динамічних зображень і визначення їхньої орієнтації можуть вирішуватися, якщо заздалегідь відомі описи цих об'єктів. Об'єкт, що розпізнається, може бути представлений декількома зображеннями, які зберігаються в базі даних. Форма об'єкта часто описується його  контуром або сукупністю параметрів, яких досить для того, щоб розрізняти об'єкти визначеного класу. Суть контурного представлення полягає в тому, що форма кожного об'єкта описується множиною його граничних точок. У цьому методі пропонується новий підхід опису плямоподібних зображень. Отримане зображення центрується і виконується перехід з декартової системи координат у полярну. За допомогою головних внутрішніх точок зображення - центра ваги  і центра зв'язності [1] визначається вісь орієнтації зображення. Кодування йде в напрямку, зворотному ходу годинникової стрілки. Крива контуру представляється початковою точкою, розташованою на осі орієнтації, і цифровим кодом, складеним з восьми напрямків. Така комбінація елементарних напрямків розглядається як дискретний варіант природного рівняння кривої:

F = { n0, n1, n2, n3, n4, n-1, n-2, n-3 }.

                        Сітку кодування утворюють промені та концентричні кола. Задається крок відстані між сусідніми колами Δρ і крок кута Δφ, від якого залежить дуга Δl, що з'єднує сусідні промені. Кодування виконується  елементарними векторами.

Загальним результатом контурного кодування є цифровий ланцюговий код, складений значеннями, що відповідають восьми елементарним напрямкам контуру зображення. Процес фор­мування результуючого цифрового коду є ітераційним, тобто, рухаючись із заданим кроком дискретизації по елементарних комірках сітки кодування, для кожної елементарної ділянки контуру зображення визначається його елементарний напрямок.

Класифікація форми контуру плямоподібних зображень.

Запропоновані методи кодування і формування геометричних ознак дають простий опис об'єкта, але не пов'язані з його розпізнаванням в якості елемента деякого класу. Опис форми зображень з незакономірним контуром і кодування контуру в полярній сітці дозволяє створити апріорну класифікацію плямоподібних зображень. Для зручності класифікації введено буквено-цифрові позначення класів і підкласів. Всі зображення розділені на три основні класи, в залежності від переваги того чи іншого напрямку, а також від відношення кількості кодових елементів до дискретних секторів. Є три основних класи - A, B, C.

Клас A: Ev1 + Ev2 + Ev3 = N;

де N - число секторів, v0 = 0; v4 = 0; v-1 = 0; v-2 = 0; v-3 = 0. В класі А присутні три векторних напрямки v1, v2 ,v3. Загальна кількість цих напрямків завжди дорівнює числу секторів. Кількість інших  п'яти напрямків дорівнює 0. Клас А містить 3 підкласи A1, A2, A3.

Клас B. Ev1 + Ev2 + Ev3 + Ev0 + Ev4 > N; v-1 = 0; v-2 = 0;  v-3 = 0

В класі В присутні п'ять  векторних напрямків n1, n2, n3, n0, n4. Загальна кількість цих напрямків більша від числа секторів N. Кількість інших  трьох  напрямків дорівнює 0. Довжина коду (загальна кількість напрямків) дорівнює кількості векторів і більша від числа секторів. Клас В містить 3 підкласи ВА, ВВ, ВС. Кожний підклас містить ще 4 підкласи. Серед зображень класу В, дефіцит опуклості у зображень підкласу ВА найменший.

Клас C: Ev1 + Ev2 + Ev3 + Ev0 + Ev4 + Ev-1 + Ev-2 +Ev-3 > N.

В класі С присутні всі вісім напрямків. Загальна кількість напрямків більша від числа секторів N. Клас C має три підкласи СА, СВ, СС.

Ідентифікація динамічних плямоподібних зображень виконується на базі апріорної класифікації з використанням інформативних ознак: центрів зв'язності та ваги, осі орієнтації, площі, міри дефіциту опуклості [1].

Висновки. Запропоновано новий підхід до кодування зображень з незакономірним контуром, що базується на поданні та описуванні зображення не в традиційній декартовій, а в полярній системі координат. Цей підхід відрізняється від відомих методів описування зображення тим, що:

1. об'єкт розпізнавання подано через геометрію контуру - найхарактернішу його ознаку;

2. отриманий код є адекватним і компактним, тобто простим, наочним та інваріантним до афінних перетворень зображення (поворот, зсув, масштабування, ущільнення);

3. опис зображення є зручним для апаратної реалізації, оскільки результуючий код складають цифри зі знаком, для представлення яких вистачає лише трьох бітів.

Отже, на основі даного опису може бути побудована класифікація зображень, яка в подальшому може використовуватися для створення бази даних зображень з незакономірним контуром.

Література:

1. Кормановський С.І., Кожем'яко В.П. Око-процесорна обробка та розпізнавання образної інформації за геометричними ознаками. Монографія. - Вінниця: «УНІВЕРСУМ - Вінниця», 2007. - 160 с.

e-mail:  kormanovski@ukr.net


Залиште коментар!

Дозволено використання тегів:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <code> <em> <i> <strike> <strong>