우리는 언어가 지닌 복잡성에 대해 자주 생각하지 않습니다. 언어는 정보와 뜻을 단어, 기호 또는 이미지 같은 의미적 단서와 함께 전달하기 위해 사용하는 직관적 행위입니다. 언어는 걷기처럼 반복 가능하고 훈련되는 행위이기 때문에 청소년기에 배우기가 더 쉽고 더 자연스럽다고 합니다. 그리고 언어는 엄격한 규칙 집합을 따르지 않으며 'C 뒤가 아니면 E 앞에 I가 온다' 같은 예외가 상당히 많습니다.
그런데 인간에게는 자연스러운 언어가, 상당한 양의 비정형 데이터와 공식 규칙의 부족, 실제 컨텍스트나 의도의 부재로 컴퓨터에는 극도로 어렵습니다. 인간이 의사소통과 작업 수행을 위해 점점 더 컴퓨팅 시스템에 의존하는 상황에서 기계 학습과 인공 지능(AI)이 관심과 탄력을 받는 이유가 바로 여기에 있습니다. AI가 정교해질수록 자연어 처리(NLP)도 정교해집니다. AI와 NLP라는 용어에서 미래 로봇의 이미지를 떠올리기 쉽지만, 우리 일상에 NLP가 작동하고 있는 기본적 사례가 이미 있습니다. 다음은 쉽게 볼 수 있는 몇 가지 예입니다.
이메일 필터
이메일 필터는 온라인에 NLP를 제일 처음 적용한 가장 기본적인 사례 중 하나입니다. 이메일 필터는 스팸 메시지임을 암시하는 특정 단어나 구절을 찾아내는 스팸 필터로 시작했습니다. 그러나 NLP의 초기 적용 사례처럼 필터링도 업그레이드되었습니다.
좀 더 새로운 방식으로 널리 적용된 한 가지 NLP 사례를 Gmail의 이메일 분류에서 찾을 수 있습니다. Gmail은 해당 콘텐츠에 따라 이메일이 세 가지 분류(기본, 소셜, 프로모션) 중 어느 한 가지에 속하는지 인식합니다. 이를 통해 모든 Gmail 사용자의 받은 편지함이 관리 가능한 크기로 유지되고 빨리 확인하고 응답하고자 하는 중요하고 관련성 있는 이메일로 구성됩니다.
스마트 어시스턴트
Apple의 Siri와 Amazon의 Alexa 같은 스마트 어시스턴트는 음성 인식 덕분에 말의 패턴을 인식한 다음 의미를 유추해서 유용한 응답을 제공합니다. 이미 잘 알고 있듯이, 우리가 "Siri야"라고 말한 뒤 질문하면 Siri가 우리가 한 말을 알아듣고 상황과 관련된 답으로 응답합니다. 또한 온도 조절기, 조명, 자동차 등 다양한 제품에서 Siri나 Alexa와 대화를 나누기 때문에, Siri나 Alexa가 가정과 일상 전반에서 불쑥 나타나는 상황에 점점 익숙해집니다.
Alexa와 Siri 같은 어시스턴트가 우리 일상을 향상하고 상품 주문 같은 특정 작업을 더 쉽게 만들며 심지어는 언제 유머 감각 있게 대답할지 자신에 대한 질문에 대답할지도 인식하기 때문에 문맥적 단서를 이해할 것으로 기대합니다. 이러한 어시스턴트가 사용자에 관해 더 많은 것을 알게 되면서 더욱 개개인에 맞춘 상호 작용이 이뤄질 것입니다. 뉴욕 타임스 기사 'Why We May Soon Be Living in Alexa's World'(우리가 조만간 Alexa의 세상에서 살게 될 수 있는 이유)에서 "더 큰 무언가가 일어나고 있습니다. Alexa는 성공적으로 이번 10년 동안 세 번째로 큰 소비자 컴퓨팅 플랫폼이 되었습니다."라고 설명했습니다.
검색 결과
검색 엔진은 NLP를 사용하여 유사 검색 행동이나 사용자 의도를 기반으로 관련 결과를 도출합니다. 따라서 보통 사람도 검색어 귀재가 되지 않고 필요한 내용을 찾을 수 있습니다.
예를 들어 Google은 사용자가 글자를 입력하기 시작하면 인기 있는 어떤 검색이 사용자의 질의에 적용될 수 있는지 예측할 뿐 아니라, 정확한 검색어보다는 사용자의 검색 의도를 인식하고 전체적인 그림을 봅니다. Google에 항공편 번호를 입력하면 비행 상태를 알 수 있고, 주식 시세 약어를 입력하면 주식 정보를 얻을 수 있으며, 수학 등식을 입력하면 계산기가 표시될 수 있습니다. 이러한 경우가 검색을 완료할 때 볼 수 있는 몇 가지 예로, NLP가 검색에서 모호한 질의를 관련 있는 개체로 연관 지어 유용한 결과를 제공합니다.
텍스트 자동 완성
자동 수정, 자동 완성, 예측 문자 같은 기능은 스마트폰에서 흔하게 볼 수 있어 당연하게 여깁니다. 자동 완성과 예측 문자는 사용자의 입력 내용에 따라 사용자의 의도를 예측하여 그 단어를 완성하거나 관련 단어를 제시한다는 점에서 검색 엔진과 비슷합니다. 자동 수정은 전체 메시지의 의미가 통하도록 단어를 바꾸기까지 합니다.
이러한 기능은 사용자를 따라 배우기도 합니다. 예측 문자는 사용하면 할수록 사용자 자신만의 특이한 언어 습관에 맞춰집니다. 이는 사람들이 각자 휴대폰에서 문장 전체를 예측 문자로만 구성해서 공유한다는 흥미로운 실험으로 이어졌습니다. 결과는 놀랍게도 각 개인을 잘 나타내고 시사하는 바가 있었습니다. 몇몇 미디어에서 결과가 다뤄지기도 했습니다.
언어 번역
스페인어 숙제를 속임수 써서 했다는 사실을 숨길 수 없는 흔적 중 하나가 문법적으로 엉망이라는 점입니다. 대다수 언어가 수평 번역이 불가능하고 서로 다른 문장 구조 순서를 가지고 있습니다. 이는 번역 서비스에서 간과되었던 점이나, 많은 시간을 거쳐 진화하였습니다.
NLP를 사용하여 온라인 번역기는 언어를 더 정확하게 번역하고 문법적으로 맞는 결과를 내놓을 수 있습니다. 이 점은 누군가와 다른 언어로 소통하려 할 때 한없이 유용합니다. 그뿐만 아니라 어떤 다른 언어에서 모국어로 번역할 때 이제는 도구에서 입력한 텍스트를 기반으로 어떤 언어인지 인식하여 번역해 줍니다.
디지털 전화 통화
우리는 모두 "이 통화는 교육 목적으로 녹음될 수 있습니다."라는 말을 듣고 있지만, 그 말이 어떤 의미인지 궁금해 본 적은 거의 없을 것입니다. 밝혀진 바에 따르면 이러한 녹음은 고객이 화가 난 경우에 직원 교육 목적으로 사용되기도 하지만, 대부분 NLP 시스템의 학습과 향후 개선을 위해 데이터베이스로 전송됩니다. 자동화된 시스템이 고객 통화를 서비스 담당자 또는 온라인 챗봇으로 보내면, 유용한 정보로 고객 요청에 응대합니다. 이는 대형 이동통신사 등 많은 기업에서 사용해 온 NLP 사례입니다.
또한 NLP를 사용하여 컴퓨터에서 생성된 언어를 인간의 말소리에 가깝게 만들 수도 있습니다. Google 어시스턴트가 미용실을 예약해 주는 내용을 담은 이 동영상이 보여주듯, 오일 교환이나 머리 커트 등을 예약하는 통화를 자동화할 수 있습니다.
데이터 분석
점점 더 많은 BI 공급업체가 데이터 시각화에 자연어 인터페이스를 제공하면서, 자연어 기능이 데이터 분석 워크플로우에 통합되는 추세입니다. 한 가지 예가 바로 더 스마트해진 시각화 인코딩으로, 데이터 의미론에 기반하여 필요한 작업에 최고의 비주얼리제이션을 제공합니다. 이로써 사람들이 자연어 문장 또는 해석하고 의미를 할당할 수 있는 몇몇 키워드로 구성된 질문의 일부를 사용하여 데이터를 탐색할 수 있는 더 많은 기회가 열렸습니다.
데이터 조사에 언어를 적용하면 접근성 수준을 높여줄 뿐 아니라, 분석가와 소프트웨어 개발자의 커뮤니티를 넘어 조직 전반에 걸쳐 분석 장벽을 낮춰줍니다.
자연어가 데이터 시각화와 탐색을 향상하는 데 어떠한 도움이 되는지 자세히 알아보려면 이 웨비나를 확인하십시오.
텍스트 분석
텍스트 분석은 다양한 언어, 통계, 기계 학습 기법을 사용하여 비정형 텍스트 데이터를 분석에 사용할 수 있는 의미 있는 데이터로 변환합니다.
정서 분석은 특히 큰 고객층을 가진 기업에는 벅차게 느껴질 수 있습니다. 그러나 NLP 기반의 도구는 소셜 미디어 댓글이나 리뷰, 브랜드명 언급까지 고객 상호 작용을 샅샅이 살펴 사람들이 하는 말을 알려줍니다. 이러한 상호 작용 분석을 통해 기업은 마케팅 캠페인의 성과를 확인하거나 최근 자주 발생하는 고객 문제를 모니터링하여 고객 경험 개선을 위해 서비스를 강화하거나 대처하는 방법을 결정할 수 있습니다.
그 외, 키워드 추출과 비정형 텍스트 데이터에서 구조 또는 패턴 찾기도 NLP가 텍스트 분석에 도움이 되는 경우입니다.
디지털 세계에서 NLP가 적용되는 사례는 무궁무진하며, 비즈니스와 업계에서 그 가치를 확인하고 수용함에 따라 더 늘어날 것입니다. 좀 더 복잡하게 얽힌 의사소통 문제는 인간의 개입이 중요하지만, NLP는 먼저 작은 업무를, 그다음 복잡한 업무는 기술 혁신을 통해 관리하고 자동화하면서 우리 삶을 개선해 나갈 것입니다.