Wierzcie lub nie, ale najmniejsze wibracje telefonu mogą ujawnić treść rozmów — dzięki sztucznej inteligencji.
Zespół naukowców z dziedziny informatyki z Penn State opracował zaskakujący nowy sposób podsłuchiwania rozmów telefonicznych na odległość poprzez dekodowanie subtelnych wibracji emitowanych przez słuchawkę telefonu komórkowego.
Wykorzystując radar fal milimetrowych w połączeniu z systemem rozpoznawania mowy opartym na sztucznej inteligencji, ich urządzenie może przechwytywać i transkrybować rozmowy z odległości do 3 metrów z dokładnością około 60%.
To przełomowe odkrycie budzi poważne obawy dotyczące prywatności w związku z potencjalnym nadużyciem takich nowych technologii.
Badania opierają się na projekcie z 2022 roku, w ramach którego zespół osiągnął 83% dokładność w rozpoznawaniu 10 wcześniej zdefiniowanych słów przy użyciu podobnego podejścia.
Nowe badania rozszerzają tę możliwość na ciągłą transkrypcję mowy, choć dokładność jest niższa ze względu na złożoność dekodowania zakłóconych danych radarowych.
„Kiedy rozmawiamy przez telefon komórkowy, zwykle ignorujemy wibracje dochodzące ze słuchawki i powodujące drgania całego telefonu” – powiedział pierwszy autor badania, Suryoday Basak, doktorant informatyki.
„Jeśli zarejestrujemy te same wibracje za pomocą zdalnych radarów i wykorzystamy uczenie maszynowe, aby pomóc nam zrozumieć, co zostało powiedziane, korzystając z kontekstowych wskazówek, możemy odtworzyć całą rozmowę. Rozumiejąc, co jest możliwe, możemy pomóc społeczeństwu uświadomić sobie potencjalne zagrożenia”.
Zespół wykorzystał czujnik radarowy fal milimetrowych, tę samą technologię, która jest stosowana w samochodach autonomicznych, czujnikach ruchu i sieciach bezprzewodowych 5G, aby zmierzyć niewielkie drgania powierzchni generowane przez mowę odtwarzaną przez słuchawkę telefonu.
Aby zinterpretować te zakłócone i niskiej jakości dane, dostosowali Whisper, otwarty model rozpoznawania mowy oparty na sztucznej inteligencji, opracowany z myślą o czystym dźwięku, wykorzystując technikę uczenia maszynowego o niskim rankingu.
Metoda ta pozwoliła im ponownie wyszkolić tylko 1% parametrów Whisper specjalnie pod kątem danych radarowych, poprawiając wyniki transkrypcji bez konieczności przebudowywania całego modelu od podstaw.
Przełom w technologii radarowej
Konfiguracja eksperymentalna polegała na umieszczeniu czujnika radarowego w odległości około trzech metrów (10 stóp) od telefonu w celu uchwycenia najdrobniejszych drgań.
Dane były następnie wprowadzane do dostosowanego modelu sztucznej inteligencji, który generował transkrypcje z około 60-procentową dokładnością dla słownictwa obejmującego do 10 000 słów.
Chociaż wynik ten jest daleki od ideału, naukowcy zauważyli, że nawet częściowe dopasowanie słów kluczowych może mieć poważne konsekwencje dla bezpieczeństwa.
„Wynikiem były transkrypcje rozmów, z oczekiwanymi pewnymi błędami, co stanowiło znaczną poprawę w stosunku do naszej wersji z 2022 roku, która generowała tylko kilka słów” – powiedział współautor Mahanth Gowda, profesor nadzwyczajny informatyki i inżynierii.
„Jednak nawet wychwycenie częściowych dopasowań mowy, takich jak słowa kluczowe, jest przydatne w kontekście bezpieczeństwa”.
Zespół porównał swoje podejście do czytania z ruchu warg, które zazwyczaj pozwala uchwycić tylko 30–40% wypowiedzianych słów, ale w połączeniu z kontekstem nadal może pomóc w zrozumieniu rozmowy.
Podobnie, wyniki działania systemu radarowo-AI, choć niedoskonałe, mogą ujawnić poufne informacje, jeśli zostaną uzupełnione wcześniejszą wiedzą lub ręczną korektą.
Zwiększone ryzyko naruszenia prywatności
Basak podkreślił potencjalne zagrożenia dla prywatności związane z tą nową technologią.
„Podobnie jak osoby odczytujące ruch warg mogą wykorzystać ograniczone informacje do interpretacji rozmów, wyniki naszego modelu w połączeniu z informacjami kontekstowymi pozwalają nam odgadnąć fragmenty rozmowy telefonicznej z odległości kilku metrów” – powiedział.
„Celem naszej pracy było zbadanie, czy narzędzia te mogą być potencjalnie wykorzystywane przez osoby o złych zamiarach do podsłuchiwania rozmów telefonicznych z daleka. Nasze wyniki sugerują, że jest to technicznie wykonalne w pewnych warunkach i mamy nadzieję, że zwiększy to świadomość społeczną, dzięki czemu ludzie będą bardziej ostrożni podczas rozmów o charakterze poufnym”.
Badania zostały wsparte przez amerykańską Narodową Fundację Naukową, a zespół podkreślił, że eksperymenty mają na celu wskazanie potencjalnych słabych punktów, zanim zostaną one wykorzystane przez osoby o złych zamiarach.
W przyszłości planowane jest opracowanie środków ochronnych, które zabezpieczą prywatne rozmowy przed tego rodzaju zdalną inwigilacją.
