4. 자료와 학습(초급) part 2. DIKW 피라미드

Part 2. 지식 피라미드 (DIWK 피라미드)

Part 1에서는 자료(Data)의 종류에 대해 살펴보았습니다. 우리는 왜 자료에 대해서 공부했을까요? 인공지능에게 자료는 왜 필요하며, 또 어떻게 활용되는 걸까요? 이에 대해 이야기하기 전에 먼저 지식 피라미드(DIWK 피라미드)에 대해 살펴보도록 합시다.

지식 피라미드는 Data(자료)-Information(정보)-Knowledge(지식)-Wisdom(지혜)의 4가지 계층으로 이루어져 있으며, 각각의 첫 글자를 따서 DIKW 피라미드라고도 부릅니다.

우리가 Part 1에서 배운 자료(Data)는 이 중 가장 아래층에 위치해 있습니다. 그 이유는 무엇일까요? 가공되기 전의 순수한 데이터 그 자체로는 의미를 가지기 어렵기 때문입니다. 이러한 데이터가 가치를 갖기 위해서는 데이터에서 정보를 추출하고 처리하는 과정이 필요합니다.

DIKW 피라미드와 인공지능

자료(Data)란 관찰, 측정을 통해서 수집된 사실이나 값, 수치, 문자 등을 의미합니다. 지식 피라미드에서 데이터가 갖는 중요한 특징은 ‘가공되지 않았다’는 사실입니다. 가공되지 않은 데이터는 그 자체로는 의미를 지니기 어렵습니다.

정보(Information)는 여러 가지 데이터 중에 사용자에게 ‘필요한’ 데이터입니다. 데이터 중에 사용자의 필요에 따라 정제되거나 가공된 데이터를 정보라고 부릅니다.

지식(Knowledge)은 정보를 일반화하고 체계화하여 바로 적용·활용할 수 있도록 만든 것을 의미합니다. 서로 연결된 정보들의 패턴을 바탕으로 예측한 결과물을 지식이라고 볼 수 있습니다.

지혜(Wisdom)는 지식에 유연성을 더하고, 상황과 맥락에 맞는 규칙을 적용하는 것을 의미합니다. 즉, 지혜는 근본적인 원리에 대한 깊은 이해를 바탕으로 하는 창의적 아이디어입니다.

인공지능은 컴퓨터가 통찰력을 갖도록 하는 데에 주된 목적이 있으며, 이는 인공지능이 궁극적으로 지혜(Wisdom)의 영역을 추구한다고 볼 수 있습니다. 그러나 컴퓨터가 아무 준비도 없이 바로 지혜의 영역에 도달할 수는 없기 때문에 가장 바닥에 위치해 있는 자료(Data)에서부터 차근차근 나아가야 합니다.

적절한 자료를 바탕으로 한 지도학습과 비지도학습은 바람직한 인공지능을 구현할 수 있겠지만, 반대로 양질의 자료를 갖지 못한 인공지능은 좋지 않은 방향으로 나아갈 수도 있습니다. 최근 인터넷을 뜨겁게 달군 이루다 역시 적절한 데이터의 필요성을 보여주는 중요한 사례라고 할 수 있지요. 사람이 가지고 있는 좋지 못한 생각들이 정제되지 않은 채 그대로 인공지능에 투입된다면, 인공지능 역시 차별과 편견을 가지게 됩니다. 따라서 적절한 자료를 선정하는 것은 매우 중요합니다.

물론, 적절한 자료가 무엇인지 판단하는 것은 상당히 복잡하고 어려운 일입니다. 하지만 우리가 충분히 고민하지 않고 만든 인공지능이 가져올 부작용을 생각한다면 오랜 시간이 걸리더라도 신중히 자료를 선정해야겠지요.

예시를 통해 알아보는 DIKW

지능이가 2개의 마트에서 전단지를 받았습니다. A마트 전단지에는 달걀 3000원, 라면 700원, 우유 1350원이라고 적혀 있고, B마트 전단지에는 달걀 2700원, 라면 650원, 우유 1200원이라고 적혀 있습니다. 마트에서 팔고 있는 3가지 품목과 그 가격이라는 자료(Data)를 확인할 수 있네요.

지능이는 라면을 사고 싶습니다. 전단지에 적힌 다양한 데이터 중, 지능이에게 필요한 데이터는 A마트의 라면이 700원, B마트의 라면이 650원이라는 것이 되겠네요. 지능이는 자신에게 필요한 데이터를 바탕으로 ‘B마트의 라면 가격이 더 저렴하다’는 정보(Information)를 얻었습니다. 이처럼 정보는 주어진 데이터 중에 필요한 것을 가공한 결과물을 의미합니다. 지능이는 라면 가격을 비교하여 정보를 얻었다고 볼 수 있지요.

지능이는 B마트의 라면 가격이 더 저렴하다는 정보를 바탕으로 ‘B마트에서 라면을 사는 것이 더 유리’할 것이라는 결론을 얻습니다. 이것이 지식(Knowledge)입니다. 전단지에 적혀 있는 데이터도 아니고, 그 데이터를 분석하여 얻은 정보도 아니지만 정보를 바탕으로 충분히 예상하여 적용할 수 있는 형태의 결론이지요. 같은 원리로 달걀과 우유도 B마트에서 사는 것이 유리하다는 지식을 얻을 수 있습니다.

B마트의 달걀, 우유, 라면 가격이 더 저렴하므로 B마트에서 3가지 품목을 구매하는 것이 유리하다는 것을 알게 된 지능이는 ‘B마트의 다른 상품도 A마트보다 저렴할 것’이라고 예측합니다. 지능이가 지혜(Wisdom)를 갖게 되었네요. 아마 두부나 아이스크림도 B마트에서 사는 것이 더 저렴하겠죠? 이처럼 상황이나 맥락에 맞게 지식을 재구성하고 근본 원리를 이해하여 얻은 창의적 아이디어인 지혜는 DIKW 피라미드에서 가장 윗층에 자리하고 있습니다.

Part 2. 지식 피라미드 Quiz

다음 중 DIKW 피라미드에 대해 알맞은 설명을 고르세요.

Correct! Wrong!

지능이의 시험 점수는 국어 70점, 수학 80점, 사회 60점, 과학 90점입니다. 자료를 바탕으로 알 수 있는 알맞은 정보를 고르세요.

Correct! Wrong!