객체 관계 데이터베이스는 관계형 데이터베이스에 객체 지향 데이터베이스의 개념을 추가한 데이터베이스이다. 객체 지향 데이터베이스 관리 시스템을 위한 표준 모델로는 ODMG 2.0 표준이 있고 객체 관계 데이터베이스를 위한 데이터 언어 표준으로는 ISO에서 제시한 SQL3가 있다.
090 고급 데이터베이스
분산 데이터베이스(Distributed Databases)
논리적으로는 같은 시스템에 속하지만 물리적으로는 컴퓨터 네트워크를 통해 분산되어 있는 데이터베이스이다.
분산 데이터베이스 시스템의 구성 요소
분산 처리기:자체적으로 처리 능력을 가지며 지리적으로 분산되어 있는 컴퓨터 시스템을 말한다.
분산 데이터베이스:지리적으로 분산되어 있는 데이터베이스로서 해당 지역의 특성에 맞게 데이터베이스가 구성된다.
통신 네트워크:분산 처리기들을 통신망으로 연결하여 논리적으로 하나의 시스템처럼 작동할 수 있도록 하는 네트워크를 말한다.
분산 데이터베이스의 목표
위치 투명성(Location Transparency):실제 위치를 알 필요가 없고 데이터베이스의 논리적인 명칭만으로 접근할 수 있다.
중복 투명성(Replication Transparency):동일한 데이터가 여러 곳에 중복되더라도 마치 하나의 데이터만 존재하는 것처럼 활용할 수가 있다.
병행 투명성(Concurrency Transparency):다수의 트랜잭션들이 동시에 실행되더라도 그 트랜잭션들의 수행 결과는 영향X
장애 투명성(Failure Transparency):트랜잭션, DBMS, 네트워크, 컴퓨터 장애에도 불구하고 트랜잭션은 정확하게 수행한다.
분산 데이터베이스의 장ㆍ단점
장점
단점
지역 자치성이 높다.
DBMS가 수행할 기능이 복잡하다
데이터의 공유성이 향상된다.
데이터베이스 설계가 어렵다
분산 제어가 가능하다.
소프트웨어 개발 비용이 증가한다.
시스템 성능이 향상된다.
처리 비용이 증가한다.
효율성 및 융통성이 높다.
잠재적 오류가 증가한다.
신뢰성 및 가용성이 높다.
점증적 시스템 용량 확장이 용이하다.
멀티미디어 데이터베이스(Multimedia Database)
텍스트, 그래픽, 정지 화상, 동영상, 음성 등이 복합적으로 구성된 데이터베이스이다.
멀티미디어 데이터베이스의 특성
데이터가 일반적으로 대용량이다.
정형화된 데이터가 아니고 검색 대상의 내용이 데이터의 중간에 있을 수 있으므로 미디어별로 별도의 검색 방법이 필요하다.
비정형 데이터이기 때문에 데이터의 구조가 복잡하고 관계를 구성하기가 어렵다.
멀티미디어 데이터베이스 구축 방법
파일 기반 기법
DBMS를 사용하지 않으며 단순한 검색 위주의 VOD(Video On Demand)등에 이용된다.
데이터의 동시 접근이 어렵고 회복 기능 등의 지원이 빈약하다.
관계형 데이터베이스 기반 기법
텍스트 데이터를 저장하기 위해서는 CLOB(Character Large Object) 데이터 타입을 이용하고, 이미지, 비디오, 오디오 등을 이용하기 위해서는 BLOB(Binary Large Object) 데이터 타입을 이용한다.
일반적으로 정형화된 데이터는 관계형 데이터베이스의 데이터 타입을 이용하고 비정형화된 데이터는 파일로 저장한다.
객체 지향 데이터베이스 기반 기법
멀티미디어를 가장 잘 표현할 수 있는 기법이다.
사용자 정의 클래스, 사용자 정의 메소드를 이용하여 미디어별로 별도의 클래스를 정의할 수 있다.
객체 관계형 데이터베이스 기반 기법
관계형 데이터베이스의 CLOB, BLOB 데이터 타입을 이용하거나 사용자 정의 클래스, 사용자 정의 메소드를 이용하여 미디어별 타입을 정의해서 사용할 수 있다.
주기억장치 데이터베이스(Main Memory Database)
데이터베이스 전체를 주기억장치에 상주시킨 후 데이터베이스 연산을 수행하는 시스템으로, 디스크 입ㆍ출력이 발생하지 않는다.
주기억 데이터베이스의 특성
모든 연산이 주기억장치에서 수행되므로 디스크 입ㆍ출력이 줄어들어 빠른 연산이 가능하다.
시스테에 문제가 생겼을 경우 복수시켜 주는 회복 작업의 구현이 어렵다.
주기억장치의 구입 비용이 많이 든다.
데이터 웨어하우스(Data Warehouse)
급증하는 다량의 데이터를 효과적으로 분석하여 정보화하고 이를 여러 계층의 사용자들이 효율적으로 사용할 수 있도록 한 데이터베이스이다.
동기
전사적인 데이터 통합을 통한 정보의 효율적인 분석이 필요하게 되었고, 신속 정확한 의사결정으로 경쟁력을 확보하기 위하여 의사결정용 데이터베이스의 필요성이 대두되었기 때문이다.
다양한 원본 데이터베이스로부터 정제되어 추출된 데이터만을 저장하고 필요한 인덱스를 생성한다. 이후, 데이터의 다차원 분석 도구로 데이터 웨어하우스를 분석하여 효율적인 의사결정에 필요한 자료를 얻는다.
장ㆍ단점
장점
단점
높은 투자 수익률을 얻을 수 있다.
타사에 비하여 경쟁우위를 획득할 수 있다.
의사 결정자의 생산성을 향상시킬 수 있다.
기존 시스템과 명확한 역할 설정을 하지 못하면 혼란을 초래할 수 있다.
추출 기준에 맞지 않는 데이터의 입력, 갱신, 삭제가 발생하면 불일치 문제가 발생할 수 있다.
의사결정을 위한 충분한 데이터가 확보되지 않으면 정확한 결과를 도출할 수 없다.
과다한 자원을 사용하게 되고 유지 보수가 어렵다.
데이터 마이닝(Data Mining)
Data Warehouse에 저장된 데이터 집합에서 사용자의 요구에 따라 유용하고 가능성 있는 정보를 발견하기 위한 기법이다.
데이터 마이닝 기법
연관(Association):대용량의 트랜잭션 데이터로부터 “A이면 B이다”형식의 연관 관계를 발견하기 위한 방법이다.
연속(Sequence):개인별 트랜잭션 이력 데이터를 시계열적으로 분석(일정 기간 동안 시간의 흐름에 따라 데이터를 분석하는 것)하여 트랜잭션의 향후 발생 가능성을 예측하는 방법이다.
분류(Classification):다른 그룹과의 차별적인 특성을 도출하기 위한 방법이다.
클러스터링(Clustering):상호간에 유사한 특성을 갖는 데이터들을 집단화하는 방법이다.
특성화(Characterization):데이터 집합의 일반적인 특성을 분석하는 것으로 데이터의 요약 과정을 통해 특성을 발견하는 방법이다.
패턴 분석(Pattern Analysis):데이터베이스 내의 명시된 패턴을 찾는 방법이다.
경향 분석(Trend Analysis):시계열 데이터들이 시간 축으로 변화하는 전개과정을 특성화하여 동적으로 변화하는 데이터를 분석하는 방법이다.