지식이란 우리 머릿속에 있는 생각을 말합니다. 우리 머릿속에는 다양한 지식이 있습니다. 우리 머릿속에 있는 생각을 밖으로 꺼내어 표현하는 것은 쉬운 일이 아닙니다. 정확하게 표현하지 않으면 상대방이 내가 생각한 것과 다르게 이해할 수 있습니다.
예를 들어 내가 머릿속에서 있는 모양에 관한 지식이 왼쪽 사진과 같이 있습니다. 이 지식을 상대방에게 설명해 똑같은 그림을 그리게 하려 합니다. 동그라미를 그린 후 모양을 그리세요. 라고 이야기하면 어떻게 표현할까요
위에 그림처럼 다양한 대답이 나올 수 있습니다. 왜 그럴까요? 내가 알고 있는 지식을 모호하게 설명했기 때문입니다. 또한 사람은 자신의 개인적 경험, 감정 등에 의해 자신의 생각과 기준대로 변형하여 정보를 받아들입니다. 그렇다면 주관적인 요소 없이 정보를 명확하고 완전하며 간략하게 표현할 수 있을까요? 우리가 사용하는 언어는 인공지능의 입장에서 이야기하면 ‘자연어’라고 합니다. 자연어로 된 지식을 인공지능이 받아들일 수 있도록 하려면 어떻게 해야 할까요?
우리가 가지고 있는 형태의 지식이 아닌 ‘기계화된 지식’이 있어야만 인공지능은 학습하고 추론하며 인지(인식)할 수 있습니다. 그렇다면 이 지식은 어떻게 형성될까요? 먼저 우리가 가지고 있는 지식이 어떻게 형성되는지부터 살펴볼 필요가 있습니다. 지식은 우리가 받아들이는 자료부터 여러 과정을 거쳐 정보, 지식, 지혜로 발전합니다.
자료(Data)란 관찰, 측정을 통해서 수집된 사실이나 값, 수치, 문자 등을 의미합니다. 지식 피라미드에서 데이터가 갖는 중요한 특징은 ‘가공되지 않았다.’는 사실입니다. 가공되지 않은 데이터는 그 자체로는 의미를 지니기 어렵습니다.
예1) 꽃을 보고 붉은색을 인지함.
예2) 자로 연필의 길이를 측정함.
정보(Information)는 여러 가지 데이터 중에 사용자에게 ‘필요한’ 데이터입니다. 데이터 중에 사용자의 필요에 따라 정제되거나 가공된 데이터를 정보라고 부릅니다.
예1) 붉은 꽃이 있는 위치를 정리하여 찾기 쉽도록 표로 만듦.
예2) 비슷한 길이의 연필을 분류하여 찾기 쉽도록 함.
지식(Knowledge)은 정보를 일반화하고 체계화하여 바로 적용·활용할 수 있도록 만든 것을 의미합니다. 서로 연결된 정보들의 패턴을 바탕으로 예측한 결과물을 지식이라고 볼 수 있습니다.
예1) 붉은 꽃이 있는 위치의 특징을 찾아 정리함.
예2) 긴 연필과 대조적으로 짧은 길이의 연필들이 상처가 많다는 규칙을 찾아 정리함.
지혜(Wisdom)는 지식에 유연성을 더하고, 상황과 맥락에 맞는 규칙을 적용하는 것을 의미합니다. 즉, 지혜는 근본적인 원리에 대한 깊은 이해를 바탕으로 하는 창의적 아이디어입니다.
예1) ‘붉은 꽃은 따뜻한 곳에서 자란다.’라는 가설을 내세움.
예2) ‘연필을 소중히 다뤄야 오래 쓸 수 있다.’라는 생각을 가짐.
자료에서 지혜로 발전하는 과정을 다시 한번 자세하게 살펴볼까요?
우리는 감각 기관을 통해 외부세계를 인지 또는 인식합니다. 그로부터 얻은 그대로의 것이 자료이며 여기에는 잡음, 불필요한 부분이 많습니다. 자료를 내가 이용할 수 있게 정리하면 정보로 발전합니다. 있는 그대로의 것이 아닌 가공하여 우리가 원활하게 이용할 수 있다는 점에서 유의미성을 가집니다. 이러한 정보들의 규칙을 분석하는 등의 과정을 거치면 지식의 영역으로 넘어가게 됩니다. 지식은 정보를 개념화 및 체계화시킨 것이기 때문에 우리가 삶을 살며 지식과 관련된 여러 경우에 적용할 수 있습니다. 여기서 한층 더 나아가 지식을 보편화시키면 지혜로 발전하게 됩니다. 이 경우 지식보다 더 높은 수준의 통찰이 내재 되어 있으며 이론화된 고차원적인 정리 및 법칙 등을 일컫습니다.
예를 들어 버스정류장에서 버스 출발 시간을 생각해봅시다. 버스정류장에서 버스 출발 시간 자체는 전혀 의미 없는 ‘데이터’입니다. 버스정류장과 버스정류장이 연결되고 정류장 순서대로 출발 시간이 되면 ‘정보’가 됩니다. 정보가 ‘지식’이 되기 위해서는 검색할 수 있는 버스정류장 시간표와 같이 유익한 것이 되어야 합니다.
이처럼 정보가 지식이 되려면 적절한 구조가 있어야 하는데 이를 ‘지식베이스’라고 합니다. 데이터와 정보를 정리하고 체계화하는 이유는 지식베이스를 만들기 위해서입니다. 그리고 우리가 인공지능을 활용하기 위해서는 컴퓨터와 사람이 동시에 이해할 수 있는 형태의 지식이 필요합니다. 이러한 형태의 지식을 ‘기계 지식’이라고 하며 이를 표현하는 것을 ‘지식표현’이라고 합니다.
우리의 언어를 기계 지식으로 바꿔볼까요? 인형 뽑기를 한다고 상상해 봅시다.
인형이 있는 장소를 기계가 알 수 있도록 설명해 볼까요? 앞에서 동그라미와 엑스 그리기처럼 다양한 결과가 나오지 않도록 명확한 표현을 사용해 봅시다.
[창 중앙 바닥에 청록색 공이 있다. -> 황색 박스가 공 왼쪽에 공의 6분의 1만큼 떨어져 있다. -> 인형은 황색 박스 위쪽 중앙에 있다.]
우리가 기계를 이용해 빨간 모자 인형을 뽑으려고 할 때 기계에 어떻게 입력해야 할까요?
[인형 뽑기 창의 왼쪽부터 4분의 1지점으로 이동하기 -> 인형 잡기 -> 인형 뽑기 창의 오른쪽 끝으로 이동하기 -> 인형 풀기]
이처럼 기계를 활용하여 문제를 해결하기 위해서는 기계가 이해할 수 있는 형태의 지식이 필요합니다. 여러분이 기계의 입장에서 생각해보면 이해가 쉬울 거예요!
인공지능은 컴퓨터가 통찰력을 갖도록 하는 데에 주된 목적이 있으며, 이는 인공지능이 궁극적으로 지혜(Wisdom)의 영역을 추구한다고 볼 수 있습니다. 그러나 컴퓨터가 아무 준비도 없이 바로 지혜의 영역에 도달할 수는 없기 때문에 가장 아래에 있는 자료(Data)에서부터 차근차근 나아가야 합니다.
인공지능에 입력할 자료의 선별도 매우 중요합니다. 만약 인간의 생각이 무분별하고 정제되지 않은 채 그대로 인공지능에 투입된다면, 인공지능 역시 인간이 가지고 있는 부정적인 시각과 차별과 편견을 가지게 됩니다. 물론, 적절한 자료가 무엇인지 판단하는 것은 상당히 복잡하고 어려운 일입니다. 하지만 우리가 충분히 고민하지 않고 만든 인공지능이 가져올 부작용을 생각한다면 오랜 시간이 걸리더라도 신중히 자료를 선정해야겠지요.
Think Good AI
인공지능에 투입될 자료가 적절한지 고려할 때 생각해야 하는 기준에는 무엇이 있을까? 어떤 자료가 적합하고 좋은 자료라고 할 수 있을까?