본문 바로가기

전체 글27

'학습'과 '추론' 그리고 '학습용 컴퓨터'와 '추론용 컴퓨터' 인공지능 분야에서 있어서 '학습'과 '훈련'의 차이점에 관한 글을 조금 전에 작성했는데, 기왕에 '학습'과 '추론'의 차이점에 대해서도 간단하게 언급해 보겠습니다. 일단 인공지능 모델은 기존의 데이터(즉, 관측 데이터)를 가지고 학습(learning)하게 됩니다. 학습을 마친 인공지능을 보통 훈련 모델(trained model)이라거나 사전 훈련 모델(pre-trained model)이라고 부릅니다. 이렇게 미리 훈련해 둔 모델을 가지고 활용하는 과정에서 모델이 하는 일을 추론(inference)이라고 합니다. 즉, 모델이 새로 들어온 데이터를 가지고 무언가를 알아낸다는 말입니다. 인공지능이 학습을 할 때에는 데이터가 많아야 하고, 이 데이터를 가지고 1만 회(epoch) 이상 반복하면서 거듭 훈련한 다.. 2020. 2. 2.
인공지능의 '학습'과 '훈련'의 관계 제가 번역을 하다 보면 인공지능의 전문가들조차도 학습과 훈련을 구분하지 않는 경우가 있고, 또한 책을 읽다 보면 그런 현상이 국내 도서의 역자나 저자에게서도 심심치 않게 나타난다는 점을 알게 되었습니다. 그러니 학생들이 이 두 용어를 혼동하는 게 어찌 보면 당연하게 발생하는 현상이라고 할 수 있겠습니다. 그러므로 이와 같은 혼동을 예방할 수 있게 학습과 훈련의 관계를 간단히 구분할 수 있도록 정리해 보겠습니다. 인공지능의 학습(learning) 과정은 훈련(training), 검증(validation), 검정(test) 과정으로 이뤄집니다. 이 과정 중에서 검정 과정이나 검증 과정 중에 어느 한 과정을 생략하는 경우도 있습니다만, 대체로 이렇게 세 과정으로 이뤄져 있다고 보아도 됩니다(참고로 검정 과정을.. 2020. 2. 2.
'4차 산업 혁명'='지능화' 최근에 4차 산업 혁명이 화두가 되었습니다. 그런데 무엇이 4차 산업 혁명이냐를 두고 공감대가 아직 형성되지 않고 있습니다. 이게 4차 산업 혁명이라거나 저게 4차 산업 혁명이다라는 식으로 저마다 다른 주장을 펼치는 경향이 있습니다. 게다가 우리나라가 아닌 미국이나 유럽에서는 4차 산업 혁명이라는 용어조차 낯설어 하는 경우도 있습니다. 오히려 '산업 4.0(industry 4.0)' 등의 용어를 가지고 다소 다른 개념을 나타내기도 합니다. 이제 저는 여기에 제 주장을 하나 더 얹어 보려 합니다. 저는 4차 산업 혁명을 '지능화'라고 봅니다. 1차 산업 혁명을 석탄과 증기기관을 동원한 '동력화'라고 보고, 2차 산업 혁명을 '전기'와 '자동제어기술' 등을 동원한 '자동화'라고 보며, 3차 산업 혁명을 '컴.. 2020. 2. 2.
'데이터점', '관측치', '사례', '예측치', '실측치', '오차', MSE, RMSE 인공지능, 머신러닝, 딥러닝 분야 및 데이터과학 분야의 기술을 익힐 때 기본 중의 기본이 되는 용어들 몇 가지를 소개해 보겠습니다. 이를 쉽게 이해할 수 있게 어떤 성적을 예측하는 인공지능 시스템을 만든다고 생각해 보겠습니다. 그리고 학생들의 성적 기록부가 다음과 같이 되어 있다고 해 보겠습니다. 줄번호 구분 콩쥐 팥쥐 1 1학기 점수 3.4 3.1 2 2학기 점수 3.2 3.3 3 3학기 점수 3.7 2.9 위 예에서 3.4, 3.1, 3.2, 3.3, 3.7, 2.9는 각기 데이터 점(data points)'에 해당합니다. 참고로 이 데이터 점을 '데이터 포인트'라고 부르는 경우도 있는데, 이는 지양하는 게 좋습니다. 데이터 점은 통계학 등에서 쓰이는 전문 용어이기 때문입니다. 그리고 위 예에서 1번.. 2020. 2. 2.
'인공지능', '머신러닝', '딥러닝'의 관계 인공지능(artificial intelligence)이란 말 그대로 인공적으로 만든 지능입니다. 그런데 지능(intelligence)이란 무엇일까요? 이를 제대로 따져 보려 한다면 깊은 철학의 세계로 내려가야 합니다. 그러므로 더 쉽게 따져 보는 방법이 몇 가지 있는데, 그중에 하나는 벽을 사이에 두고 기계와 사람이 마주 보고 선 다음에, 사람이 하는 질문에 기계가 반응을 했을 때, 기계가 사람인지 기계인지를 알아보기 힘들다면 해당 기계는 사람처럼 '지능'을 지녔다고 보는 방법이 있습니다. 사람이나 동물이 지닌 자연스러운 지능이 아니고 사람이 만들어 낸 지능이므로 '인공지능'이라고 부를 수 있을 것입니다. 이러한 인공지능을 만들어 내기 위한 방법은 여러 가지입니다. 프로그램으로 어떤 규칙을 나열해서 지능.. 2020. 2. 2.
'딥러닝'과 '심층학습' 딥러닝(deep learning)을 우리말로 옮기자면 '심층학습'이 적절합니다. '깊은 학습'이라고 부르는 경우도 있지만 '심층학습'이 더 적절한 이유는 학습에 동원되는 인공신경망이 계층(layer)을 이루고 있으며, 이 계층들이 3개 이상인 인공신경망은, 그 계층의 깊이가 '심층적'이라고 보기 때문입니다. 단순히 '깊다'라고 해 버리면 이러한 계층의 개념을 제대로 나타낼 수가 없습니다. 물론 모든 용어가 그렇듯이 용어에는 모호함이나 외연이나 내포라는 성질도 있으므로 '깊다'는 말이 잘못된 용법이라는 뜻은 아닙니다. '깊은 신경망'이라고 해도 잘못된 건 아니지만, 기왕이면 '심층 신경망'이라고 할 때 그 개념을 '상대적으로' 더 정확히 나타낼 수 있다는 말입니다. '심층 인공신경망(deep artific.. 2020. 2. 2.
지능형 사물인터넷이란? 지능형 사물인터넷(smart IoT)이란 사물인터넷을 이루는 각 장치에 인공지능을 접목한 시스템을 말합니다. 한편으로는 일종의 군집 지능(cluster intelligence, 무리 지능)을 발현하게 사물인터넷 망을 구성한 경우에도 지능형 사물인터넷이라고 할 수 있을 것입니다. 이 두 가지 경우가 합쳐져 각 장치가 인공지능을 갖추고, 이런 장치들이 모여서 또 다시 군집 지능을 발현(emergence)하게 한 시스템은 더 발전된 지능형 사물인터넷이라고 할 수 있습니다. 저는 이게 4차 산업 혁명 시대에 아주 중요한 역할을 할 것으로 봅니다. 산업 혁명 단계를 구분하는 방법은 서로 다른데, 제 생각에는 동력화(증기 기관이 대표적 현상)가 1차 산업 혁명, 자동화(전기 및 자동제어가 대표적 현상)가 2차 산업.. 2019. 10. 23.