반응형

저번시간까지 인공지능, 머신러닝에 대해서 알아보았고, 오늘은 간단하게 딥러닝이 무엇인지 알아보자.

딥러닝(Deep Learning)

= 인공신경망을 사용하는 머신러닝 방식

딥러닝을 간단하게 요약하자면 인공신경망을 사용하는 머신러닝 방식이다. 딥러닝이라는 개념을 몰라서 찾아봤더니 더 어려운 개념으로 딥러닝을 설명하네.. 할 수도 있겠지만 차근차근 알아가보자. 일단 큰 틀만 잡자면 딥러닝은 인공신경망이라는 개념을 사용한다!! 딱 이것만 기억하자.

신경망(Neural Network)

일단 인공신경망을 알아보기전에 더 간단한 개념인 신경망이라는 개념을 집고 넘어가자. 모두들 신경망이라는 단어는 어디서 배우지 않아도 필수 어휘로 알고 있을 것이다. 신경망, 위 사진처럼, 우리 몸안에서 자극들을 받아들이고, 내가 몸을 움직이고 싶으면 움직이라는 신호를 전달해주고, 그런 통로역할을 하는 것이 신경망이다. 고등학교때 중추신경계, 자율신경계, 말초신경계 등등 거기서 배우던게 우리가 알고 있는 그 신경망이라는 개념과 동일하다. 여기까지는 아마 이해하는데 큰 어려움이 없을 것이다. 그럼 이 신경망은 어떻게 동작하는 것 일까?

뉴런(Neuron)

=신경망의 동작 원리

 

자 신경망이 동작하는 상황을 좀 구체적으로 풀어보자. 예를들어, 우리가 뜨거운 물건에 손을 댔을때 순간적으로 손을 떼게된다. 느리게 살펴보면 손을 댄순간 통각이라는 자극신호가 신경망을 통해 뇌까지 갔다가, 뇌에서는 손을 당장 떼!!! 라는 명령을 손에 내린다. 이 명령 신호는 다시 신경망을 통해 손까지 돌아가게 된다.

살짝 느리게 관찰해 봤는데, 이런 자극신호들이 신경망을 통해서 오고가는것은 이제 알겠다. 하지만 우리가 진짜로 궁금해해야하는 것은 신경망이 어떻게 자극을 전달하는지 궁금해 해야한다. 바로 위 사진에 나와있는 뉴런이라는 신경세포가 자극을 전달한다.

뉴런(Neuron)의 동작 원리

뉴런이 어떻게 동작하는지 알아보기 전에 뉴런의 구조부터 익혀야한다. 저 빨간 박스에 그려진 친구가 하나의 뉴런이다. 뉴런은 여러개의 가지돌기들과 한개의 촉색돌기로 이루어져 있다. 이 모습을 눈에 익혀놔야한다.

자. 이제 뉴런이 어떻게 동작하는지 알아보자. 먼저 가지돌기들이 자극을 받아들인다. 그림엔 3개 밖에 안그려놨지만 가지돌기는 여러개가 있기 때문에 n개가 있다고 하겠다. 저 가지 돌기들은 각각의 고유 가중치들이 있다. 저 가중치가 의미하는 것은 어떤 자극을 받아들이는데 있어서 가장 중요한 가지돌기라는 것이다.

 

즉, 가지돌기1처럼 가중치가 1인 친구는 상대적으로 낮기때문에 해당 자극을 받아들이는데 있어서 큰 역할을 하는 돌기는 아니기때문에 아주 큰 영향이 안가지만, 가지돌기 2처럼 55의 가중치는 주변 가지돌기들보다 아주 큰 가중치이기 때문에 작극을 받아들이는데 있어서 아주 큰 영향을 주는 가지돌기들이라는 것이다.

가중치가 높은 가지돌기가 중요한 신호

일단 여러개의 가지돌기들이 자극을 받아들인다고 했다. 그리고 이 종합적으로 받아들인 결과값들을 다 더한 값이 이 뉴런이 생각하는 특정 임계치 이상이면 뉴런이 활성화되고, 그렇지 않으면 활성화 되지 않는다.

여기서 활성화라는 것은 뭘까? 활성화는 Activation 됐다고 하며, 뉴런 꼬리에 해당하는 촉색돌기에 다음 뉴런으로 전달하라는 신호를 주는 것을 뜻한다. 촉색돌기에 신호가 들어오면 촉색돌기 말단에서 시냅스를통해 다음 뉴런으로 신호가 전잘된다. 이렇게 뉴런에서 다음 뉴런, 그 뉴런에서 그 다음뉴런, 뉴런에서 뉴런~~~~~~뉴런~~~~쭈구우우욱~ 어마무시한 뉴런들을 거쳐 비로소 뇌까지 도달하게 되는 것이다.

뉴런(Neuron)의 임계치(Threshold)

자 다시 뒤로 돌아가서 임계치(Threshold)라는게 뭘까? 뉴런의 구조를 보면 특이한점이 있다. 자극을 받아들이는 가지돌기들은 여러개인데 최종적으로 다음 뉴런으로 신호를 전달하기 위한 돌기는 하나다. 맞다. 뉴런은 자극들을 받아들여 종합한후 자기가 뒤로 자극을 전달해야하는지 말지를 판단해서 신호를 전달하는 것이다.

그래서 위에서말한 자극을 뒤로 전달해야할지 말지가 바로 임계치다. 예를들어 3개의 자극 10, 23, 7이 들어왔다고 보자, 각 가지돌기들의 가중치(중요한 신호라고 생각하는 정도)를 입력 자극에 곱해서 총 합쳐주자,

가지돌기1의 입력 : 10 x 가중치 1 = 총 10

가지돌기2의 입력 : 23 x 가중치 55 = 총 1265

가지돌기3의 입력 : 7 x 가중치 17 = 119

뉴런의 총 입력자극의 합 : 1394

자 간단한 계산을 통해 뉴런이 느끼는 자극의 합을 알아냈다. 1394인데, 여기서 해당 뉴런의 임계점이 1300이라면(예를들어) 현재 1300보다 큰 1394라는 자극이 들어왔으니 촉색돌기에 신호를 주어 다음 뉴런으로 자극신호를 전달하는 것이다. 와우, 아주 구체적인 과정을 통해서 뉴런이 어떻게 동작하는지 알아보았다.

반대로 임계치가 1300인데 모든 가지돌기들의 자극 합이 1299라면? .. 촉색돌기는 활성화되지 않는다. 즉 1이라도 부족하면 활성화 되지 않고 특정한 어느 임계점을 넘어야지만 활성화 되는 것이다. 우리가 중고등학교때 배웠던 역치라는 개념과 동일하다고 생각하면 된다.

자 여기까지 뉴런에 대해서 알아보았다! 인공신경망을 이해하기 위한 기초를 쌓은셈이다. 이제 인공신경망이 무엇인지 알아보자.

인공신경망(Artificial Neural Network) / ANN

인공 뉴런으로 만들어진 신경망

자 인공신경망은 말그대로 저 위에서 말한 모든 과정을 수학적으로 모델링하여 인위적으로 만든 신경망이다. 인공신경망에도 뉴런이 있고, 그 뉴런은 인공 뉴런이라고 부른다. 이 인공 뉴런을 수학적으로 모델링 한것이 퍼셉트론(Perceptron)이라는 개념인데, 이 개념은 다음 포스팅에서 구체적으로 알아볼 예정이다.

이 인공신경망 구조를 사용하는 이유는 사실 AI 발전의 난제였던 논리적베타합(XOR) 문제를 극복할 수 있는 방법으로 제시되었기 때문이다. 향후 이 신경망 알고리즘을 통해 어떻게 XOR 문제를 극복했는지도 알아볼꺼니 당장 어..? 저게 뭐지 ㅠㅠ 할 필요는 없다. 일단, 여기서 알아둬야할 것으론, 인공신경망은 사람의 신경망과 유사하게 동작하는 수학적 모델이다~~ 라고 생각하면된다. 여기서 계속 수학적으로 라는 말을 하는 이유는 ㅋㅋ 진짜 뭐 소스코드로 쭈르륵 써서 만든 개념이 아니라, 논리적인 증명이 수학적으로 가능하기 때문이다. 나중에 이 수학적인 부분도 다루겠지만 맛보기로 알려준다면, 미분, 적분, Convolution, Dot Product 등 선형 대수의 개념으로 구현해냈다.

딥러닝(Deep Learning)이란 무엇인가?

다시 처음으로 돌아왔다. 딥러닝이 뭘까? 바로 위에서 말했던 인공신경망 모델을 통해서 머신러닝하는 개념을 보통 딥러닝 이라고 한다. 그러니까 딥러닝과 인공신경망이랑 뗄레야 뗄수가 없는 구조인거다. 이제 딥러닝의 개념이 어느정도 잡히는가? 이해가 잘 안간다면 딥러닝을 이해하려고 하지말고 인공신경망이 무엇인가? 라고 생각해보고, 인공신경망을 통해 어떻게 머신러닝을 할 것인가?의 내용이 바로 딥러닝에대한 모든 것이다.

머신러닝(Machine Learning)과 딥러닝(Deep Learning)과의 관계

 

자 딥러닝은 머신러닝의 한 분야라고했다. 그럼 머신러닝에 딥러닝 말고 뭐가있을까? 뭐 여러가지들이 있지만 간단한걸로는 선형 회귀, 로지스틱 회귀 등 여러가지 방법이 있다. 이 다른 방법들중 딥러닝의 특징은 비정형 데이터들을 잘 다룬다는 것이다.

비정형데이터라고하면 통계나 수치가 정리되어있는 엑셀표처럼 이미 만들어진 데이터들이 아닌 이미지, 영상, 음성, 소리, 텍스트, 번역 등 뭔가 실시간? 혹은 변칙수가 많은 입력들이 들어와 분석할때 딥러닝이 강하다. 그래서 신경물질을 전달하는 뉴런에서 영감을 받았는지도 모른다.

반면에 선형회귀, 로지스틱 회귀 같은 방법은 정형 데이터에 강하다. 정형데이터라고 함은 데이터베이스, 레코드파일, 엑셀 등 뭔가 수치나 통계로 뽑힌 데이터들이다. 뭐 예를들면 2010~2020년도 유방암 환자에 대한 신체 수치들에 대한 데이터들, 이런 정적인 데이터들을 읽어들여 결과를 내는데 더 좋은 성능을 발휘한다.

 

이제 앞으로 인공신경망의 최소 단위인 퍼셉트론과 퍼셉트론을 여러개 깔아 단일 계층 퍼셉트론(SLP), 다중 계층 퍼셉트론(MLP) 등 인공신경망의 기초내용을 탄탄히 다진 후 코드 실습을 할 예정이다.

[딥러닝] #4 인공신경망(ANN)과 딥러닝(Deep Learning)에 대해 알아보자! / 뉴런(Neuron)의 동작 원리

#딥러닝 #인공신경망 #ANN #DP #뉴런 #촉색돌기 #촉삭돌기 #가지돌기 #가중치 #임계치 #Threshold #기초 #기본 #개념

반응형
반응형

DBMS(DataBase Mangement System)의 정의

① 사용자와 데이터베이스 사이에서 사용자의 요구에 따라 정보를 생성하고 DB를 관리해 주는 소프트웨어

② 기존 파일시스템이 갖는 종속성, 중복성문제를 해결하기 위해 제안된 시스템으로 모든 응용프로그램이 DB를 공유하게함

③ DB의 구성, 접근 방법, 유지관리에 대한 모든 책임을 짐

기존 파일시스템의 문제점
① 종속성
② 중복성

 

① 종속성으로 인한 문제점

응용프로그램과 데이터 파일이 상호 의존적인 관계에서는 파일이 변경되면 프로그램도 같이 변경해야한다.

② 중복성으로 인한 문제점

① 일관성 : 중복된 데이터 간에 내용이 일치하지 않는 상황이 발생해 일관성이 사라진다.

② 보안성 : 중복되어 있는 모든 데이터에 동등한 보안수준을 유지하기 어렵다.

③ 경제성 : 저장공간의 낭비와 동일한 데이터의 반복 작업으로 비용이 증가한다.

④ 무결성 : 제어의 분산으로 데이터의 정확성을 유지할 수 없다.

DBMS의 필수 기능
① 정의
② 조작
③ 제어

① 정의(Definition) 기능

① 저장될 데이터의 형(Type)과 구조에 대한 정의, 이용 방식, 제약 조건 등을 명시하는 기능

② 데이터간의 관계를 명확하게 명세할 수 있어야 하며, 원하는 데이터 연산은 무엇이든 명세 할 수 있어야 한다.

② 조작(Manipulation) 기능

① 데이터 검색(Slect), 갱신(Update), 삽입(Insert), 삭제(Delete) 등을 처리하는 기능

③ 제어(Control) 기능

① 무결성 : 갱신, 삽입, 삭제가 정확하게 수행되어 데이터의 무결성을 유지하도록 제어함

② 권한 검사 : 정당한 사용자가 허가된 데이터만 접근하도록 보안을 유지하고 권한을 검사함

③ 병행 제어 : 동시에 여러 사용자가 데이터에 접근할 때 항상 정확성을 유지하도록 병행제어함

DBMS의 장/단점

장점

단점

ㆍ데이터의 논리적, 물리적 독립성이 보장됨

ㆍ데이터의 중복을 피할 수 있어 공간이 절약됨

ㆍ저장된 자료를 공동으로 이용할 수 있음

ㆍ데이터의 일관성을 유지할 수 있음

ㆍ데이터의 무결성을 유지할 수 있음

ㆍ보안을 유지할 수 있음

ㆍ데이터를 표준화할 수 있음.

ㆍ데이터를 통합하여 관리할 수 있음.

ㆍ항상 최신의 데이터를 유지함

ㆍ데이터의 실시간 처리가 가능함.

ㆍ데이터베이스의 전문가가 부족함

ㆍ전산화 비용이 증가함

ㆍ시스템이 복잡함

ㆍ대용량 디스크로 집중적인 접근으로 과부화 발생

ㆍ파일의 예비와 회복이

단어 노트

① 병행 제어(Concurrency Control) : DBMS가 여러 사용자가 동시에 DB에 접근하도록 여러개의 트랜잭션을 동시에 수행하는 것.

 

 

#정보처리기사 #정처기 #데이터베이스 #개념 #DBMS #파일시스템 #종속성 #중복성 #정의 #조작 #제어 #장단점

 

 

 

 

 

 

 

 

 

 

반응형
반응형

데이터 베이스의 정의

특정 조직의 업무를 수행하는 데 필요한 상호 관련된 데이터들의 모임

① 통합된 데이터(Intergrated Data) : 자료의 중복을 배제한 데이터의 모임

② 저장된 데이터(Stored Data) : 컴퓨터가 접근할 수 있는 저장매체에 저장된 자료

③ 운영 데이터(Operational Data) : 조직의 고유한 업무를 수행하는 데 존재 가치가 확실하고 없어서는 안 될 자료

④ 공용 데이터(Shared Data) : 여러 응용 시스템들이 공동으로 소유하고 유지하는 자료

  즉 데이터베이스란 데이터를 중복을 배제하여 통합해 저장장치에 저장하여, 여러 사람에 의해 공동으로 사용할 수 있도록 운영하는 운영 데이터이다.

 

데이터 베이스의 특징

① 실시간 접근성(Real-Time Accessibility) : 수시적이고 비정형적인 질의에대해 실시간 응답이 가능해야함

② 계속적인 변화(Continuous Evolution) : DB의 상태는 동적이다, 즉 새로운 삽입, 삭제, 갱신으로 항상 최신 데이터 유지

③ 동시 공용(Concurrent Sharing) : 동시에 다수의 사용자가 DB의 데이터를 이용할 수 있음

④ 내용에 의한 참조(Content Reference) : 데이터 참조시 주소나 위치에 의해서가 아닌 데이터 내용으로 찾음.

데이터 베이스 시스템

데이터베이스를 이용하여 자료를 저장하고 관리하여 정보를 얻어내는 데 필요한 컴퓨터 중심의 시스템

ㆍ데이터베이스 ㆍ스키마 ㆍDBMS ㆍDB 언어 ㆍDB 컴퓨터 ㆍDB 사용자

의 구성요소들을 가지고 있지만 크게 중요하진 않음. 나중에 더 자세하게 설명되니 넘어가면 됨


#정보처리기사 #정처기 #데이터베이스 #개념 #정의 #특징 #데이터베이스시스템 #DBMS

 

반응형
반응형

자료 : 관찰이나 측정을 통해 수집한 단순한 사실 = 가공되지 않은 상태

정보 : 의사 결정에 도움을 줄 수 있는 유용한 형태로 자료를 가공해서 얻은 결과

정보시스템

→ 조직에 필요한 자료를 수집/저장해 두었다가 필요시 처리해서 의사결정에 유용한 정보를 생성하고 분배하는 수단을 말함

자료 처리 시스템

① 일괄 처리 시스템

② 온라인 실시간 처리 시스템

③ 분산 처리 시스템

 

① 일괄 처리 시스템

일정 시간 또는 일정량의 데이터를 모아 한번에 처리하는 시스템.

① 시스템 중심 자료 처리 방법

② 반환 시간이 늦지만 하나의 작업에 모든 자원을 독점해 CPU 유휴시간이 줄어듬

③ 순차 접근 방법을 사용하는 업무에 적당함 → 급여 계산, 회계 마감, 세무 처리, 수도/전기요금, 연말 정산 등

④ 단위 시간당 처리하는 작업수가 많으므로 시스템 성능은 높다

⑤ 트랜잭션당 처리 비용이 적다

② 온라인 실시간 처리 시스템

데이터 발생 즉시 또는 데이터 처리 요구가 있는 즉시 처리하여 결과를 산출함

① 사용자 중심 자료 처리 방법

② 처리 시간이 단축되고, 처리비용이 절감된다.

③ 우주선 운행, 레이더 추적, 핵물리학 실험, 전화 교환장치, 은행 온라인 업무 등 시간이 제한되는 작업에 사용됨

③ 분산 처리 시스템

지리적으로 분산되어 있는 여러대의 컴퓨터를 통신 회선으로 연결

① 각 단말기나 컴퓨터 시스템은 고유의 운영체제와 CPU, 메모리를 가지고 있음

② 시스템의 구축이나 운영이 복잡한 반면, 신뢰성이 높고 확장이 용이하다.

 

단어 노트

① 데이터 웨어하우스(Data Warehouse) : 정보 시스템을 운영하기 위해 업무중 발생한 다양한 데이터를 모은것

② 유휴 시간(Idle Time) : 실제적인 작업이 없는 시간

③ 트랜잭션(Transaction) : 컴퓨터가 처리해야 할 단위 작업

 

 

반응형

+ Recent posts