책소개
AI, 포용적 기술의 방향
보는 방식을 바꾸면 삶의 동선이 달라진다. 인공지능은 시각 정보를 해석해 말하고, 위험을 감지하며, 길을 안내하는 동료가 된다. 이미지 설명, 문자 읽기, 실내외 내비게이션, 스마트 화이트케인과 로봇 안내견, 스마트폰 기반 컴퓨터 비전 앱까지 현장의 요구에서 출발한 사례들이 독립성과 자율성을 키운다.
동시에 딥페이크, 데이터 편향, 프라이버시 침해, 에너지 소비 같은 그늘을 냉정히 짚고 공정성·안전·책임의 기준을 제시한다. 360도 카메라 이상 탐지와 VQA를 포함한 최신 연구, 사용자 참여형 HCI 방법, 접근성 표준과 정책 동향을 한데 묶어 ‘사람을 향한 기술’의 조건을 설계한다. 핵심은 속도가 아니라 방향이다. 아무도 소외되지 않는 설계를 위해, 개발·현장·정책이 연결되는 실행 지도를 제안한다.
200자평
AI가 시각 정보를 읽고 말해 주는 기술로 이동·정보·안전을 확장한다. 이미지 설명·문자 읽기·스마트 화이트케인·로봇 안내 등 실용 사례와 함께 딥페이크·편향·프라이버시 문제를 다루고, VQA·이상 탐지 연구와 사용자 참여 설계를 통해 ‘따뜻한 AI’의 기준과 정책 방향을 제시한다. AI총서. aiseries.oopy.io에서 필요한 인공지능 지식을 찾을 수 있다.
지은이
이장원
성균관대학교 컴퓨터교육과 및 실감미디어공학과 부교수다. 인디애나대학교(Indiana University Bloomington)에서 Informatics 전공, Intelligent and Interactive Systems Track 으로 박사 학위를 받았다. 삼성전자 소프트웨어센터에서 Software Engineer로 근무했으며, 미국 NASA JPL에서 연구 인턴, 미국 Alarm.com 산하 ObjectVideo Lab에서 Research Scientist로 재직했다. 현재 성균관대학교에서 인공지능 및 상호작용 연구실(Intelligent and Interactive Systems Lab, I2S Lab)을 이끌며 컴퓨터 비전, 로봇 비전, 인간-컴퓨터 상호작용 분야의 연구를 수행하고 있다. CVPR, ECCV, ICRA, IROS, WACV, IJCAI, ICIP, UbiComp 등 주요 국제학회에 다수의 논문을 발표했으며, 2017년 CVPR 워크숍 ‘Deep Learning for Robotic Vision’에서 최우수 논문상을, 2025년 APIC-IST에서 우수 논문상을 수상했다.
차례
인공지능의 그늘과 빛
01 인공지능의 그늘
02 인공지능의 빛
03 사회적 약자를 위한 인공지능
04 컴퓨터 비전의 기초와 발전
05 시각장애인을 위한 컴퓨터 비전
06 로봇 기술과 시각장애인 지원
07 스마트폰과 컴퓨터 비전
08 시각장애인을 위한 이상 탐지와 VQA
09 시각장애인과 함께, 현장의 목소리
10 사람을 향한 기술, 따뜻한 AI
책속으로
인공지능은 방대한 데이터를 기반으로 학습하고 작동하는데, 이 과정에서 두 가지 문제가 두드러진다. 하나는 데이터의 편향성으로 인해 인공지능 알고리즘이 한 개인 또는 집단에 대해 불공정하거나 차별적인 결정을 내릴 수 있다는 것이고, 다른 하나는 인공지능 모델의 학습 데이터 수집 과정에서 개인 프라이버시 침해가 발생할 가능성이 높다는 점이다. 이러한 문제들이 다양한 인공지능 서비스들이 사회 곳곳으로 빠르게 확산되고 있는 지금, 그대로 방치된다면 앞으로 더 심각한 결과로 이어질 수 있다.
-01_“인공지능의 그늘” 중에서
최근 인공지능 기술은 청각장애인의 생활 속 안전을 돕는 측면에서도 활발히 이용되고 있다. 대표적으로 주변의 중요한 소리-화재 경보기, 초인종, 자동차 경적 등-를 감지해 시각적(빛, 알림) 또는 촉각적(진동) 신호로 알려주는 기술이 있다. 예를 들어, 아마존 링(Amazon Ring)과 같은 스마트 초인종은 단순히 방문자의 존재를 알리는 것을 넘어 화재 경보기, 일산화탄소 감지기 등 생활 속 중요한 소리를 포착해 사용자의 스마트폰으로 알림을 전달함으로써, 청각장애인의 생활 안전과 독립성을 높이고, 일상의 불안을 줄여주는 데 기여하고 있다.
-03_“사회적 약자를 위한 인공지능” 중에서
시각장애인 보행 보조를 위한 주요 웨어러블 디바이스는 동작 방식에 따라 크게 두 가지로 나눌 수 있다. 하나는 감각 네트워크(Sensorial networks) 기반으로 동작하는 장치로, 이들은 초음파, 적외선, GPS, RFID 등 각종 센서를 통해 주변 정보를 수집하고 음성이나 촉각 신호로 사용자에게 안내를 전달하는 방식으로 동작한다. 이런 감각 네트워크 기반 웨어러블 디바이스는 사용성 측면에서 직관적이지만, 높이 있는 장애물이나 움직이는 물체를 감지하거나 GPS 정확도가 떨어지는 건물 내부에서의 사용에 한계가 있다.
-06_“로봇 기술과 시각장애인 지원” 중에서
저자의 연구팀은 2025년 8월 현재, 미시간주립대학교(Michigan State University)와 국제 공동 연구로 시각장애인 근로자들이 실제 근무하는 환경에서 경험하는 어려움을 관찰하고, 이를 바탕으로 필요한 인공지능 기술을 개발하는 것을 목표로 첫 단계의 연구를 진행 중이다. 이를 위해 저자의 대학원생 연구원 2명이 2025년 7월부터 미시간주립대학교 이희린(Hee Rin Lee) 교수 연구실에 파견되어 현지 연구팀과 함께 활발히 연구를 수행하고 있다.
-09_“시각장애인과 함께, 현장의 목소리” 중에서