서울대 공대 윤성로 교수 연구팀, 한글을 더 바르게 구사하는 ‘인공지능 학습용 데이터셋’ 발표

바른 한글 구사하는 인공지능 개발 위한 의미 있는 첫걸음 기대

최종윤 기자
입력 2021.10.09 08:30
댓글 0

이 기사를 공유합니다

[인더스트리뉴스 최종윤 기자] 서울대학교 공과대학(학장 이병호)은 윤성로 전기정보공학부 교수팀이 한글날을 맞아 10월 9일 한국어 언어 모델의 사회적 편향(social bias) 진단을 위한 데이터셋 K-StereoSet를 공개했다.

인공지능의 사회적 편향은 미래 인공지능 연구에서 전 세계적으로 중요한 키워드로 대두되고 있다. 국내의 경우 올 초 인공지능 기반 한국어 챗봇인 ‘이루다’로부터 성소수자, 인종, 장애인 등에 대한 차별 및 혐오성 표현이 발견돼 화제가 된 바 있다.

이런 문맥에서 최근 대통령직속 4차산업혁명위원회와 과학기술정보통신부가 인간성(humanity)을 위한 인공지능(artificial intelligence, AI)의 3대 원칙 중 하나로 ‘인간의 존엄성 원칙’을, 10대 핵심 요건 중 하나로 ‘다양성 존중’을 제시했을 만큼 윤리적인 인공지능에 대한 중요성이 커지고 있다.

그럼에도 최근까지도 자연어 처리(natural language processing) 분야의 근간이 되는 인공지능 기반 한국어 언어 모델에 대한 연구가 활발히 이뤄지고 있으나, 이들의 사회적 편향을 진단할 수 있는 수단은 여전히 부족한 상황이다.

이런 문제의식 하에 윤성로 교수팀이 이번에 공개하는 K-StereoSet은 영어 언어 모델의 사회적 편향을 진단하기 위해 MIT에서 공개한 ‘StereoSet’의 개발셋(development set)을 기반으로 한국적 현실에 맞춰 보완 개발한 것으로, 앞으로 지속적으로 확장될 예정이다.

약 4,000개의 샘플로 구성된 원본 데이터셋은 먼저 네이버 파파고 API를 통해 1차적으로 번역한 후 다수 연구원이 독립적으로 번역 내용을 검수했다. 원래의 샘플 양식과 취지를 보존하도록 후처리(post-processing)를 진행해 구축됐다.

데이터 내 사회적 편향의 분야는 성별, 종교, 직업, 인종 총 네 가지 항목으로 구성돼 있으며, 편향성 진단을 위한 샘플 양식은 두 개의 카테고리로 분류돼 있다.

첫 번째는 문장 내 편향 진단 테스트를 위한 ‘intrasentence’ 양식이다. 빈칸 처리된 문장이 주어졌을 때 빈칸에 채워질 내용으로서 세 개의 보기 중 어느 것에 높은 점수를 부여하는지를 이용해 진단한다. 예를 들어 위의 왼쪽 예시처럼 한 문장 안에서 ‘심리학자’라는 직업의 사람이 ‘독선적’이라는 편향을 가졌는지를 확인할 수 있다.

두 번째는 문장 간 편향 진단 테스트를 위한 ‘intersentence’ 양식이다. 앞 문장(context)이 주어졌을 때 다음 문장으로서 세 개의 선택지가 주어지며 이들 중 어떤 문장에 높은 점수를 부여하는지를 이용해 진단한다. 예를 들어 위의 오른쪽 예시처럼 사람이 ‘히스패닉’이라는 문맥이 주어졌을 때, 다음 문장에서 그 사람이 ‘불법적인 시민’이라는 편향을 가졌는지 확인할 수 있다.

연구를 주도한 송종윤 연구원은 “문장 내 편향 진단 샘플 중 unrelated 라벨에 해당하는 문장은 문맥과 전혀 관계없는 단어가 빈칸에 들어가기 때문에 자동 번역 시 원문 의미를 벗어나기 쉽다”면서, “또한 문장 간 편향 진단 샘플의 보기 문장들은 context 문장을 고려하지 않는 경우가 발생하는 등의 특수한 상황들에 유의하며 변환을 진행했다”고 말했다.

연구 책임자인 윤성로 교수는 “인공지능 기반의 한국어 언어 모델이 고도화되고 사업화될 수록 윤리성 확보 및 편향성 제거를 위한 노력이 핵심적이며, 한글날을 맞아 보다 바른 한글을 구사하는 인공지능 기술 개발을 위해 K-StereoSet가 작지만 의미 있는 첫걸음이 되기를 기대한다”고 밝혔다.

관련기사

최종윤 기자 news@industrynews.co.kr

다른기사 보기

개의 댓글

BEST댓글

BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.

내 댓글 모음

롯데, 연말 인사 '퍼즐 맞추기'…장고 거듭하는 까닭은

분기 최대 실적에도 실적 차이는 8배…토스·카카오페이증권 희비 교차

삼성전자, ‘2025 C랩 스타트업 데모데이’ 개최… 혁신 스타트업과 함께 미래를 열다

엔씨 '아이온2', 출시 초반 이용자 지표는 '맑음'.. BM 논란딛고 '고군분투'

대규모 만기도래에 은행들, 10~20% 초고금리 이벤트 적금 출시 '눈길'

에스원 신임 사장에 정해린 삼성물산 리조트부문 사장 내정

쿠팡, 고객 4500여명 개인정보 유출…배송지·주문 이력까지 노출

국회 정무위·기업은행, 美 뉴욕서 한국계 스타트업·벤처캐피털 간담회

두나무·네이버파이낸셜, 27일 합병 공식 발표…‘20조 메가 핀테크’ 출범

글로벌 태양광모듈 제조기업
TCL Solar

ST200호 발간 기념
고객 초청 축하회

솔라톡톡
초경량 PV모듈

안스톡 5화
제조데이터 표준

[포토] 우리종합계측기, 고정밀 배터리 부하/용량 시험기 공개

[포토] 신산이엔지, ‘파워모듈·차단기’ 등 EV 및 EV 충전기 핵심부품 선봬

[포토] 퓨어만, 내구성 및 효율 극복한 ‘EV 충전기용 액침냉각 시스템’ 선보여

[포토] 쉴드원, 전기차 화재 막는 무인 자동 소화 진압 시스템 ‘S-캡’

[포토] 한성기공, 반응기·저장조·플랜트 시공까지… 배터리 생산설비 원스톱 제공

국내 연구진, 전고체 배터리 수명↑ 고성능 필름 고분자 전해질 개발

[기고] 재사용 ESS 상용화의 출발선 ‘안전성’ : KC10031 검사기관·검사 절차·활용 방안

국내 연구진, ‘꿈의 배터리’ 전고체전지 열화 원인 규명

[기고] 새로운 에너지 허브로 변모하는 주차장, 현장 최적 운용 방안

[전문가 칼럼] 한국환경분석학회에 거는 기대와 새로운 역할

[전문가 칼럼] 엔비디아 젠슨황이 한국에 남긴 것

[기고] 재사용 ESS 상용화의 출발선 ‘안전성’ : KC10031 검사기관·검사 절차·활용 방안

페펄앤드푹스, 원격 진단 지원하는 VOC 이벤트 카메라 출시… 다양한 트리거 옵션 제공

독일 산업 자동화 전문기업 페펄앤드푹스(Pepperl+Fuchs)가 원격 진단을 지원하는 VOC 이벤트 카메라를 출시했다.VOC 이벤트 카메라는 소프트웨어, 하드웨어, 모션 입력 등 다양한 트리거 옵션을 통해 이벤트 발생 전후 최대 900초까지 영상을 녹화한다. 사용자는 이를 활용해 문제와 원인을 파악하고 기록할 수 있다.이 제품에는 순환 버퍼 기능이 탑재돼 있다. 영상을 지속적으로 버퍼링하다가 트리거 신호가 들어오면 설정된 길이만큼 내장 메모리에 저장하는 방식이다. 라이브 스트리밍은 물론 타임스탬프와

슈나이더일렉트릭, IDC 마켓스케이프 ‘에너지 전환 서비스’ 리더 선정

에너지 관리 및 자동화 분야의 디지털 혁신을 선도하고 있는 글로벌 기업 슈나이더일렉트릭(한국지사 대표 권지웅)이 IDC 마켓스케이프(IDC MarketScape) ‘2025년 전세계 에너지 전환 전문 서비스 부문 벤더 평가’에서 리더로 선정됐다.슈나이더일렉트릭은 이번 리더 선정을 통해 지속가능한 에너지 전환을 추진하는 기업들의 신뢰받는 파트너로서의 입지를 재확인했다. 이번 평가는 에너지 집약적 산업이 넷제로 목표를 달성할 수 있도록 지원하는 역량과 전략에 대해 종합적으로 판단하는 방식으로 진행됐다.ID

KAIST, 과학문화 대중화 본격화… KSOP·OPEN KAIST로 ‘교육 나눔’ 확산

KAIST(총장 이광형)는 정부의 과학문화 확산 정책에 발맞춰 과학 대중화를 기반으로 한 사회공헌 프로그램인 ‘과학교육나눔(KSOP)’, ‘OPEN KAIST’, ‘일반인을 위한 KAIST형 IT·AI 사관학교’를 운영하고 있다고 25일 밝혔다.KAIST 이광형 총장은 “KSOP과 OPEN KAIST는 경제적·지역적 여건에 상관없이 모든 아이들이 과학자를 꿈꿀 수 있도록 돕는 KAIST의 핵심 프로그램”이라며, “앞으로도 KAIST는 첨단 과학기술을 넘어 따뜻한 과학, 포용적 교육, 지속 가능한 과학문

아이엘, 한국형 휴머노이드 ’아이엘봇’ 공개… 글로벌 탑티어 로봇기업 플랫폼 기반

신기술 소재 전문기업 아이엘(대표 송성근)이 글로벌 탑티어 로봇 기업의 상용 휴머노이드 로봇 플랫폼을 기반으로 한 한국형 휴머노이드 로봇 ‘아이엘봇’을 공개하며 제조·물류 자동화 시장 진출을 공식화했다고 24일 밝혔다.아이엘봇은 글로벌 탑티어 기업이 이미 상용화한 휴머노이드 로봇 플랫폼을 기반으로 하며, 성능과 양산성이 검증된 구조를 갖고 있다. 아이엘은 해당 플랫폼에 한국 제조환경에 필요한 AI·센서·배터리·제어 기술을 통합·현지화하고 있다. 협력사명은 양사 간 체결된 NDA에 따라 비공개된다.글로벌