본문 바로가기

통계 및 데이터분석26

비정형 데이터베이스가 왜 생겼을까? CAP이론, RDBMS, NoSQL 비정형 데이터베이스가 왜 생겼을까? CAP이론, RDBMS, NoSQL 1. 비정형 데이터베이스 배경 빅데이터는 데이터의 크기가 매우 크며 데이터 형태가 비정형적이고 다양하다는 특징이 있다. 기존 정형 데이터 베이스만으로 빅데이터를 해결할 수 없기 때문에 비정형데이터베이스가 생겨났으며, 대용량의 데이터를 신속하게 처리하기 위해 분산 시스템 이용에 대한 필요성이 생겨났다. 이를 통해 비정형 데이터베이스인 NoSQL과 Hadoop이 생겨났으며 대용량 데이터를 신속처리할 수 데이터베이스가 등장하였다. 2. CAP이론 CAP이론은 NoSQL의 이론적 배경으로 대용량 분산 데이터 저장소는 일관성, 가용성, 지속성을 모두 만족시키는 것이 불가능하다. 따라서 전략적으로 세 가지중 두 가지만 선택해야한다는 이론이다. .. 2023. 6. 25.
[통계적 연구방법] 기술통계법: 엑셀과 R로 기술통계량 구하기 기술통계법: 엑셀과 R로 기술통계량 구하기 논문 작성 시 기술테이블을 제공하여 논문을 검사받는다.통계 모든 데이터를 제공하는것이 아닌 대표적인 위치정보, 변동성 정보를 제공하며필요에 의해 정리하여 논문을 작성한다. 기술통계법을 통해 마케팅 시스템 고도화할 수 있으며 경영 의사결정에 도움을 줄 수 있다. 수집한 자료는 나타내는 방법은 아래 세가지로 나눌 수 있다. 횡단면자료 : 짧은 시기에 여러 데이터를 수집한 자료를 말하며 주로 설문조사와 같이 데이터를 모아 정리한 자료를 말한다. 변수를 오른쪽으로 나열하고 데이터 추가시 아래쪽으로 추가한다. 샘플의 수가 중요하며 샘플사이즈가 작을 때 통계적 오류가 일어난다. 시계열데이터 : 한 개체의 시간의 흐름에 따른 변화 분석을 한 데이터이며 한 개체 여러 변수를 .. 2023. 6. 25.