기사 메일전송
서울대 공대 윤성로 교수 연구팀, 한글을 더 바르게 구사하는 ‘인공지능 학습용 데이터셋’ 발표
  • 조기환
  • 등록 2021-10-08 11:12:02

기사수정


▲ [사진제공 = 서울대학교 공과대학]

서울대학교 공과대학(학장 이병호)은 윤성로 전기정보공학부 교수팀이 한글날을 맞아 9일(토) 한국어 언어 모델의 사회적 편향(social bias) 진단을 위한 데이터셋 K-StereoSet를 공개한다고 8일 밝혔다.


인공지능의 사회적 편향은 미래 인공지능 연구에서 전 세계적으로 중요한 키워드로 대두되고 있다.


국내의 경우 올 초 인공지능 기반 한국어 챗봇인 ‘이루다’로부터 성소수자, 인종, 장애인 등에 대한 차별 및 혐오성 표현이 발견돼 화제가 된 바 있다(하단 그림 참조). 이런 문맥에서 최근 대통령직속 4차산업혁명위원회와 과학기술정보통신부가 인간성(humanity)을 위한 인공지능(artificial intelligence, AI)의 3대 원칙 중 하나로 ‘인간의 존엄성 원칙’을, 10대 핵심 요건 중 하나로 ‘다양성 존중’을 제시했을 만큼 윤리적인 인공지능에 대한 중요성이 커지고 있다.


그럼에도 최근까지도 자연어 처리(natural language processing) 분야의 근간이 되는 인공지능 기반 한국어 언어 모델에 대한 연구가 활발히 이뤄지고 있으나, 이들의 사회적 편향을 진단할 수 있는 수단은 여전히 부족한 상황이다.


이런 문제의식 하에 윤성로 교수팀이 이번에 공개하는 K-StereoSet는 영어 언어 모델의 사회적 편향을 진단하기 위해 MIT에서 공개한 ‘StereoSet’의 개발셋(development set)을 기반으로 한국적 현실에 맞춰 보완 개발한 것으로, 앞으로 지속적으로 확장될 예정이다. 약 4000개의 샘플로 구성된 원본 데이터셋은 먼저 네이버 파파고 API를 통해 1차적으로 번역한 후 다수 연구원이 독립적으로 번역 내용을 검수했다. 원래의 샘플 양식과 취지를 보존하도록 후처리(post-processing)를 진행해 구축됐다.


데이터 내 사회적 편향의 분야는 성별, 종교, 직업, 인종 총 네 가지 항목으로 구성돼 있으며, 편향성 진단을 위한 샘플 양식은 두 개의 카테고리로 분류돼 있다.


첫 번째는 문장 내 편향 진단 테스트를 위한 ‘intrasentence’ 양식이다. 빈칸 처리된 문장이 주어졌을 때 빈칸에 채워질 내용으로서 세 개의 보기 중 어느 것에 높은 점수를 부여하는지를 이용해 진단한다. 예를 들어, 위의 왼쪽 예시처럼 한 문장 안에서 ‘심리학자’라는 직업의 사람이 ‘독선적’이라는 편향을 가졌는지를 확인할 수 있다.


두 번째는 문장 간 편향 진단 테스트를 위한 ‘intersentence’ 양식이다. 앞 문장(context)이 주어졌을 때 다음 문장으로서 세 개의 선택지가 주어지며 이들 중 어떤 문장에 높은 점수를 부여하는지를 이용해 진단한다. 예를 들어, 위의 오른쪽 예시처럼 사람이 ‘히스패닉’이라는 문맥이 주어졌을 때, 다음 문장에서 그 사람이 ‘불법적인 시민’이라는 편향을 가졌는지 확인할 수 있다.


연구를 주도한 송종윤 연구원은 “문장 내 편향 진단 샘플 중 unrelated 라벨에 해당하는 문장은 문맥과 전혀 관계없는 단어가 빈칸에 들어가기 때문에 자동 번역 시 원문 의미를 벗어나기 쉽다. 또한 문장 간 편향 진단 샘플의 보기 문장들은 context 문장을 고려하지 않는 경우가 발생하는 등의 특수한 상황들에 유의하며 변환을 진행했다”고 말했다.


연구 책임자인 윤성로 교수는 “인공지능 기반의 한국어 언어 모델이 고도화되고 사업화될수록 윤리성 확보 및 편향성 제거를 위한 노력이 핵심적이며, 한글날을 맞아 보다 바른 한글을 구사하는 인공지능 기술 개발을 위해 K-StereoSet가 작지만 의미 있는 첫걸음이 되기를 기대한다”고 밝혔다.

0
  • 목록 바로가기
  • 인쇄


이전 기사 보기 다음 기사 보기
많이 본 뉴스더보기
  1. 중구치매안심센터, ‘찾아가는 치매 조기검진’ 실시 (뉴스21일간/노유림기자)=울산 중구보건소(소장 이현주)에서 운영하는 중구치매안심센터가 오는 3월부터 11월까지 매주 화, 수, 금요일마다 ‘찾아가는 치매 조기검진’을 실시한다.    중구치매안심센터는 동(洞) 행정복지센터와 노인복지시설 등을 돌아가며 방문해 주민들을 대상으로 △치매 조기검진 △맞춤형 치매 상담 △치매 ...
  2. 중구, 2026년 1분기 현업근로자 안전보건교육 실시 (뉴스21일간/노유림기자)=울산 중구(구청장 김영길)가 2월 20일 오후 3시 중구청 대회의실에서 2026년 1분기 현업근로자 안전보건교육을 실시했다.    이번 교육은 「산업안전보건법」 제29조에 따른 법정 정기교육으로 근로자의 건강을 증진하고 각종 안전사고를 예방하기 위해 마련됐다.    이번 교육에는 김영길 중구청장과 ...
  3. 중구, ‘도서관 행복 우책통 사업’ 1기 활동 성과보고회 및 간담회 개최 (뉴스21일간/노유림기자)=울산 중구(구청장 김영길)가 2월 20일 오전 11시 30분 지역의 한 식당에서 ‘도서관 행복 우책통 사업’ 1기 활동 성과보고회 및 활동가 간담회를 진행했다.    ‘도서관 행복 우책통 사업’은 아이들이 익명으로 고민 사연을 보내면 따뜻한 위로와 조언이 담긴 손 편지 답장을 전달하고 나아가 맞춤형 도서를 ...
  4. 아름다운가게 울산본부, ‘아름다운 나눔보따리’ 50개 전달 (뉴스21일간/노유림기자)=아름다운가게 울산본부(본부장 장혜경)가 2월 20일 오후 2시 중구청 구청장실을 찾아 750만 원 상당의 ‘아름다운 나눔보따리’ 50개를 전달했다.    이번 전달식에는 김영길 중구청장과 장혜경 아름다운가게 울산본부장 등 3명이 참석했다.    아름다운 나눔보따리는 반찬류, 식용유, 칫솔, 치약, 비누 ...
  5. 슬도환경지킴이, 환경정화 봉사 및 용왕제 행사 개최 울산동구슬도환경지킴이[뉴스21일간=임정훈]슬도환경지킴이는 2월 21일 우수가 지나고 봄기운이 느껴지는 주말을 맞아 슬도 일원에서 환경정화 봉사활동과 함께 용왕제를 개최했다.이번 행사는 슬도의 쾌적한 환경을 보전하고 지역 전통문화를 계승하기 위해 마련됐다.행사는 1부와 2부, 3부로 나뉘어 진행됐다.먼저 오전 9시부터 9시 50분까.
  6. 보령서 ‘2026 만세보령머드배 JS컵 한국유소년 축구대회’ 개막 보령시는 20일부터 26일까지 일주일간 보령스포츠파크와 웅천체육공원이 유소년 축구 열기로 뜨겁게 달아오를 예정이라고 밝혔다.      전국에서 모인 72개 유소년팀, 총 1,500명의 선수단은 연령대별(U12, U11) 조별리그와 토너먼트를 거치며 기량을 겨룰 예정이다.        이번 대회는 집중도 높은 운영을 위해 보령스포...
  7. 이스라엘, F‑35I 장거리 작전 능력 향상 장비 도입 이스라엘이 자국 공군이 운용하는 F‑35I ‘아디르’ 전투기에 스텔스 성능을 유지하면서 항속거리를 늘리는 연료탱크를 장착했다고 보도됐다. 이는 외부 연료 탱크를 장착해도 레이더 탐지 위험을 최소화하기 위한 설계로 알려졌다.이 기술적 변화는 이란과의 긴장 속에서 장거리 비행 능력을 강화하려는 노력의 일환으로 해석된다.보도에...
사랑더하기
sunjin
대우조선해양건설
행복이 있는
오션벨리리조트
창해에탄올
더낙원
모바일 버전 바로가기