Świta Robert

BRANŻA: IT, USŁUGI DLA NIEPEŁNOSPRAWNYCH, RATOWNICTWO, KULTURA I SZTUKA

TEMAT PRACY DOKTORSKIEJ: SYSTEM WSPOMAGANIA ORIENTACJI PRZESTRZENNEJ OSÓB NIEWIDOMYCH OPARTY NA KONWERSJI OBRAZÓW 2D DO POSTACI DŹWIĘKU PRZESTRZENNEGO


Absolwent Wydziału Elektroniki, Telekomunikacji i Informatyki Politechniki Gdańskiej.
Doktorant i asystent w Katedrze Systemów Multimedialnych i Sztucznej Inteligencji na Wydziale Elektroniki i Informatyki Politechniki Koszalińskiej.
Zainteresowania naukowe: algorytmy tworzenia grafiki 3D, przetwarzanie dźwięku i obrazu, algebra liniowa, sieci neuronowe i algorytmy genetyczne, techniki multimedialne.
Kontakt: robert.swita@wp.pl

 

ZASTOSOWANIE BADAŃ W BIZNESIE:

Tematem pracy doktorskiej jest stworzenie proptotypu nowoczesnego systemu wspomagania orientacji dla osób niewidomych. Na podstawie obrazów z kamery system rozpoznaje obiekty, które stają się źródłami dźwięku. Tworzony dźwięk jest poddawany filtracji umożliwiającej rozpoznanie lokalizacji przestrzennej źródła. Służą do tego celu filtry cyfrowe dla lewego i prawego ucha o charakterystykach określonych przez funkcje HRTF (Head Related Transform Function) wyznaczanych eksperymentalnie dla źródła dźwięku w położeniu określonym kątami azymutu i elewacji. Rozpoznawanie obrazu dokonywane jest na podstawie informacji o kolorze pikseli w przestrzeni HSV (barwie, nasyceniu i jasności) i stara się uniezależnić od nierównomiernego oświetlenia obiektów. Innowacyjnością tworzonego systemu słyszenia obrazów jest sposób segmentacji obrazu, metoda rozpoznania obiektu przy wykorzystaniu kaskadowo połączonych sieci neuronowych uwzględniająca kształt, położenie oraz kontekst otoczenia obiektu, jak również w przypadku niepewnego rozpoznania – unikalny sposób tworzenia dźwięku przestrzennego na podstawie informacji o kształcie i położeniu obiektu. Dodatkową zaletą systemu jest wykorzystanie próbek instrumentów muzycznych przy użyciu interfejsu MIDI (w celu uzyskania większej harmonii i możliwości przekazania informacji o barwie obiektu związanej z rodzajem użytego instrumentu), zmodyfikowanego o możliwość odtwarzania nut o określonym położeniu przestrzennym.

Korzyści ze stworzenia tego typu urządzenia mogą być bardzo wymierne. System konwersji obrazu na dźwięk przestrzenny może być wykorzystany m.in. do:

  • poprawy komfortu życia i niezależności osób niepełnosprawnych,
  • zwiększenia zakresu postrzegania w warunkach szczególnego zagrożenia (np. konwersja obrazu z tyłu głowy),
  • przekazywania ciągłej informacji lokalizacyjnej (dźwiękowa mapa położenia),
  • jako niewyczerpalne źródło inspiracji muzycznej dla kompozytorów.

Sposób generowania dźwięku przestrzennego na podstawie rozpoznanego obrazu został zgłoszony do opatentowania.

PLANY DALSZEGO ROZWOJU:

Planowane jest zwiększenie możliwości i poprawa jakości rozpoznania poprzez wykorzystanie wirtualnej mapy świata, budowanej na podstawie najlepszego rozpoznania obiektów znajdujących się w tym samym położeniu na mapie. System wykorzystywałby stały punkt odniesienia lub śledził ruchy użytkownika systemu przy użyciu żyroskopów, akcelerometrów i systemu GPS. W ten sposób system zostanie wyposażony w pamięć o wcześniej rozpoznanych obiektach. Pamięć pozwoli również na lepsze rozpoznanie obiektów dzięki wykorzystaniu informacji o obiektach znajdujących się w pobliżu – poprzez uwzględnienie kontekstu w którym użytkownik się znajduje. Rozwój systemu związany jest również z możliwością jego wykorzystania nie tylko w celu wspomagania osób niepełnosprawnych.

NAGRODY I WYRÓŻNIENIA:

Uczestnik dotychczas nie otrzymał nagród i wyróżnień.