기사 메일전송
서울대 공대 윤성로 교수 연구팀, 한글을 더 바르게 구사하는 ‘인공지능 학습용 데이터셋’ 발표
  • 조기환
  • 등록 2021-10-08 11:12:02

기사수정


▲ [사진제공 = 서울대학교 공과대학]

서울대학교 공과대학(학장 이병호)은 윤성로 전기정보공학부 교수팀이 한글날을 맞아 9일(토) 한국어 언어 모델의 사회적 편향(social bias) 진단을 위한 데이터셋 K-StereoSet를 공개한다고 8일 밝혔다.


인공지능의 사회적 편향은 미래 인공지능 연구에서 전 세계적으로 중요한 키워드로 대두되고 있다.


국내의 경우 올 초 인공지능 기반 한국어 챗봇인 ‘이루다’로부터 성소수자, 인종, 장애인 등에 대한 차별 및 혐오성 표현이 발견돼 화제가 된 바 있다(하단 그림 참조). 이런 문맥에서 최근 대통령직속 4차산업혁명위원회와 과학기술정보통신부가 인간성(humanity)을 위한 인공지능(artificial intelligence, AI)의 3대 원칙 중 하나로 ‘인간의 존엄성 원칙’을, 10대 핵심 요건 중 하나로 ‘다양성 존중’을 제시했을 만큼 윤리적인 인공지능에 대한 중요성이 커지고 있다.


그럼에도 최근까지도 자연어 처리(natural language processing) 분야의 근간이 되는 인공지능 기반 한국어 언어 모델에 대한 연구가 활발히 이뤄지고 있으나, 이들의 사회적 편향을 진단할 수 있는 수단은 여전히 부족한 상황이다.


이런 문제의식 하에 윤성로 교수팀이 이번에 공개하는 K-StereoSet는 영어 언어 모델의 사회적 편향을 진단하기 위해 MIT에서 공개한 ‘StereoSet’의 개발셋(development set)을 기반으로 한국적 현실에 맞춰 보완 개발한 것으로, 앞으로 지속적으로 확장될 예정이다. 약 4000개의 샘플로 구성된 원본 데이터셋은 먼저 네이버 파파고 API를 통해 1차적으로 번역한 후 다수 연구원이 독립적으로 번역 내용을 검수했다. 원래의 샘플 양식과 취지를 보존하도록 후처리(post-processing)를 진행해 구축됐다.


데이터 내 사회적 편향의 분야는 성별, 종교, 직업, 인종 총 네 가지 항목으로 구성돼 있으며, 편향성 진단을 위한 샘플 양식은 두 개의 카테고리로 분류돼 있다.


첫 번째는 문장 내 편향 진단 테스트를 위한 ‘intrasentence’ 양식이다. 빈칸 처리된 문장이 주어졌을 때 빈칸에 채워질 내용으로서 세 개의 보기 중 어느 것에 높은 점수를 부여하는지를 이용해 진단한다. 예를 들어, 위의 왼쪽 예시처럼 한 문장 안에서 ‘심리학자’라는 직업의 사람이 ‘독선적’이라는 편향을 가졌는지를 확인할 수 있다.


두 번째는 문장 간 편향 진단 테스트를 위한 ‘intersentence’ 양식이다. 앞 문장(context)이 주어졌을 때 다음 문장으로서 세 개의 선택지가 주어지며 이들 중 어떤 문장에 높은 점수를 부여하는지를 이용해 진단한다. 예를 들어, 위의 오른쪽 예시처럼 사람이 ‘히스패닉’이라는 문맥이 주어졌을 때, 다음 문장에서 그 사람이 ‘불법적인 시민’이라는 편향을 가졌는지 확인할 수 있다.


연구를 주도한 송종윤 연구원은 “문장 내 편향 진단 샘플 중 unrelated 라벨에 해당하는 문장은 문맥과 전혀 관계없는 단어가 빈칸에 들어가기 때문에 자동 번역 시 원문 의미를 벗어나기 쉽다. 또한 문장 간 편향 진단 샘플의 보기 문장들은 context 문장을 고려하지 않는 경우가 발생하는 등의 특수한 상황들에 유의하며 변환을 진행했다”고 말했다.


연구 책임자인 윤성로 교수는 “인공지능 기반의 한국어 언어 모델이 고도화되고 사업화될수록 윤리성 확보 및 편향성 제거를 위한 노력이 핵심적이며, 한글날을 맞아 보다 바른 한글을 구사하는 인공지능 기술 개발을 위해 K-StereoSet가 작지만 의미 있는 첫걸음이 되기를 기대한다”고 밝혔다.

0
  • 목록 바로가기
  • 인쇄


이전 기사 보기 다음 기사 보기
많이 본 뉴스더보기
  1. 개학기 맞이 청소년 유해환경 민관 합동 점검 동구청[뉴스21일간=임정훈]울산 동구는 개학기를 맞아 지난 3월 19일 오후 7시부터 일산해수욕장 및 인근 상가 밀집 지역을 중심으로 청소년 보호 및 건전한 성장 환경 조성을 위한 청소년 유해환경 민관 합동 지도점검을 했다.    이번 점검에는 동구청, 동부경찰서, 동구시민경찰연합회(회장 김동정) 20여 명이 참석하였으며, 학교 주...
  2. 동구, 제81회 식목일 나무심기 행사 개최 동구청[뉴스21일간=임정훈]울산 동구는 제81회 식목일을 맞아 3월 20일 오전 10시 30분 미포구장 인근 염포산 등산로 일원(화정동 산160-2번지)에서 지역 주민과 공무원, 자생 단체 등 150여 명이 참여한 가운데 나무 심기 행사를 개최했다.    이번 행사는 생활권 주변 산림을 가꾸고 녹지 공간을 확충하기 위해 마련됐으며, 이날 참가자들...
  3. 울산 동구 가온누리봉사대, 군고구마 판매 수익금 100만 원 기탁 화정동 행정복지센터[뉴스21일간=임정훈]울산 동구 소재 봉사단체인 울산동구 가온누리봉사대(회장 이선미)는 3월 20일 화정동 행정복지센터를 방문해 지역 취약계층을 위해 써달라며 군고구마 판매 수익금 100만 원을 전달했다.이날 전달된 성금은 가온누리봉사대가 지역 주민들과 함께 진행한 군고구마 판매 활동을 통해 마련된 것으로, 어...
  4. 울산 동구 아이돌봄지원센터 아이돌보미 아동 학대 예방 교육 진행 울산동구아이돌봄지원센터[뉴스21일간=임정훈]울산동구아이돌봄지원센터(대표 권오헌)는 3월 19일과 20일 이틀간 오전 10시 30분~11시 30분 꽃바위문화관에서 울산 동구 아이돌봄지원센터 소속 아이돌보미 및 전담 인력을 대상으로 아동학대 예방 교육을 했다.    이번 교육은 아동학대 행동 예방 및 올바른 훈육 기술 습득, 보호자와의 ...
  5. 동구보건소, 제19회 암 예방의 날 홍보 캠페인 울산동구보건소[뉴스21일간=임정훈]울산 동구보건소는 암 예방 및 조기 검진의 중요성을 알리고 건강에 대한 인식을 높이기 위해, 3월 20일 오후 2시부터 동울산종합시장에서 지역 주민을 대상으로 ‘제19회 암 예방의 날’을 기념하는 국가암검진 홍보 캠페인을 했다.    매년 3월 21일인 ‘암 예방의 날’은 세계보건기구(WHO)에서 지...
  6. 박맹우 전 울산시장, 국힘 공천 배제 불복 및 재심 청구 (뉴스21일간/노유림기자)=국민의힘 울산시장 공천 결과에 대한 후폭풍이 거세지는 가운데, 컷오프된 박맹우 전 울산시장이 19일 울산시의회 프레스센터에서 기자회견을 열고 당의 결정에 대한 강력한 불복 의사를 밝혔다. 박 전 시장은 “공천관리위원회가 합당한 사유 설명 없이 언론을 통해 일방적으로 컷오프를 통보했다”며, 이미.
  7. 울주군, 2026년 첫 ‘이웃사랑 온기나눔 마을통합활동’ 성료 (뉴스21일간/노유림기자)=울주군은 지난 14일 범서읍 척과마을 일원에서 주민 맞춤형 ‘이웃사랑 온기나눔 마을통합활동’을 성공적으로 마쳤다고 밝혔다. 울주군전문자원봉사단협의회가 주관하고 울주군자원봉사센터가 주최한 올해 첫 통합 봉사에는 이순걸 울주군수와 최길영 울주군의회 의장, 자원봉사자 등 대거 참석해 자리를 ...
사랑더하기
sunjin
대우조선해양건설
행복이 있는
오션벨리리조트
창해에탄올
더낙원
모바일 버전 바로가기