TAR 파일 – 4.본문 구조

파일 헤더가 완성되었으면 뒤이어 파일 내용이 들어가게 됩니다. 파일 내용은 512 바이트의 배수로 기록됩니다. 만약 파일크기가 1바이트부터 512 바이트사이라면 1블록(512바이트)을 사용하고 513바이트부터 1024바이트까지는 2블록(1024바이트)을 사용하는 식입니다. 결국 TAR 아카이브에서의 파일…

Continue ReadingTAR 파일 – 4.본문 구조

TAR 파일 – 1.개요

TAR(Tape ARchive) 아카이브 파일은 1970년대 자기테이프에 백업 & 검색하기 위하여 유래되었다고 합니다만 지금은 주로 여러 개의 파일을 묶어 전송하기 위하여 사용됩니다. 기본적으로 TAR 아카이브는 여러 개의 파일을 전혀 압축하지 않은…

Continue ReadingTAR 파일 – 1.개요

HTML 파서 – 4.배열 구조의 구성

다차원 배열 구조 앞 장의 예제에서 보았듯이 파서 배열 구조는 다차원 배열(multi-dimensional array)로 구성되어 있습니다. 배열 구조를 보기 위해 사용하였던 var_dump() 함수 대신에 다차원배열 상태 그대로 보게 되면 아래와 같습니다.…

Continue ReadingHTML 파서 – 4.배열 구조의 구성

HTML 파서 – 3.배열 구조를 보여주는 예제

배열구조를 보여주는 예제 HTML 문서 우선 아래와 같은 HTML 문서(파일명:sample.html)가 있다고 하지요. HTML 문서를 분석하는 예제 아래는 위에 있는 HTML 문서를 이 함수에 의해 분석하여 생성된 배열구조를 보여주는 예제(파일명:test.php)입니다. 예제…

Continue ReadingHTML 파서 – 3.배열 구조를 보여주는 예제

HTML 파서 – 2.파서 관련 함수

제공되는 함수 현재는 xml 파서 함수 중 xml_parse_into_struct 함수를 모델링한 html_parse_into_struct 함수만 제공됩니다. 함수 버전 기능 클래스명 html_parse_into_struct 0.0.1 HTML 데이터를 배열 구조로 분석 HtmlParser int html_parse_into_struct (string data, array…

Continue ReadingHTML 파서 – 2.파서 관련 함수

HTML 파서 – 1.개요

HTML 규약에 의해 작성된 문서를 분석하는 함수입니다. 0.0.1p2에서는 아래의 예와 같이 0.0.1p1에서 속성값에 인용부호가 나타날 때 생기는 문제점을 일부 해결하기 위해 약간 수정하였습니다. 위와 같이 바깥쪽 인용부호를 생략한 채 xxx@xxxxx.com을…

Continue ReadingHTML 파서 – 1.개요