728x90 Computer S&E14 [Hadoop] 하둡 기본 기초 Basics 설명 1 RDMS: 대규모 데이터를 빠르게 조회 HDFS 클라이언트들이 바라봤을 때 끊기지 않게 string access seek time / transfer rate : 탐색 시간 / 대역폭 대역폭이 커진 속도를 탐색 시간이 못 따라잡았다 latency : 데이터를 읽으려고 할 때 hadoop은 processing 시간이 필요 seek time이 줄어 디스크 블럭 사이즈가 작아지면 디스크 공간 효율은 좋아지는데 병목 디스크 블럭 사이즈가 작아지면 main node가 데이터를 많이 읽어와야 함 B-Tree (RDMS) vs MapReduce structured data - csv / RDMS 관리 용이 semi-strucured data - json / Hadoop에서 관리 unstructured data - i.. 2022. 9. 30. [컴퓨터구조] Performance 어디에 중점을 두느냐에 따라 컴퓨터 성능이 달라진다 performance = 수행 시간의 역수 CPU time에 집중한다 - Clock cycle rising edge에서 data 전송. 다음 rising edge마다 state가 변한다 period: 주기, rate: period의 역수 수행 시간 = clock cycles * cycle time = clock cycles / rate 수행 시간이 가장 중요 2022. 9. 8. 이전 1 2 3 다음 728x90 반응형