아파치 타조 (Apache Tajo) 한글 문서 프로젝트 리소스 및 진행 공유

지난 블로그 포스트 Tajo 한글 프로젝트 프로젝트를 시작에 대해 공유를 했습니다. 이 포스트에서는 짧았지만 몇 일간의 진행과 프로젝트 리소스 정보들을 공유합니다.

프로젝트 리소스 정보는 아래와 같습니다.

현재까지 번역된 페이지는 아래와 같습니다.

또한 현재 SQL 섹션을 남윤민 님이 님이 번역 진행 중이십니다.

사실 Tajo 문서의 양이 그렇게 많지가 않습니다. 그리고 주요 Tajo 개발자들이 한국인이다 보니 아무래도 영문 작성 보다는 한글 작성이 더 쉬운 면이 있습니다. 그래서 문서 추가를 우선 한글로 하고 한글에서 영문으로 번역하는 작업도 고민하고 있습니다. 꾸준히 진행되면 영문과 한글 문서 모두 풍성해지라 기대합니다.

Update

  • 1월 1일 오후 5시에 번역된 페이지 목록 수정

아파치 타조 (Apache Tajo)의 한글 문서화 프로젝트를 시작합니다.

Tajo를 더 보급해보려는 노력으로 Apache Tajo의 한글 문서화 프로젝트를 시작하려고 합니다. 자세한 내용은 아래 링크를 참고 하세요.

https://github.com/hyunsik/tajo-doc-kr

일단은 번역으로 시작하지만 잘 작성된 내용은 upstream에 반영하려고 합니다.

막 github 저장소를 만들고 아직 번역된 내용은 없습니다만 꾸준히 해보려고 합니다. 관심 있으신 분들은 메일이나 메시지를 주시구요.


float과 long 타입의 implicit casting

4 byte 짜리 float이 8 byte 짜리 long보다 widen 더 넓은 범위를 표현하는 type 이었다. 지금까지 Tajo에서 float 과 long의 산술 연산에서 둘다 double로 casting 하고 처리했었는데 사실은 long을 float으로 casting 한 후 해야 IEEE 754에 기반한 결과가 나오는 것이었음.

(4월 28일 Updated ) precision은 당연히 64bit인 long이 더 높다. 하지만 수의 표현 범위만 봤을 때는 float이 더 넓다. 따라서 float과 long의 산술 연산은 long이 float으로 implicit conversion 되어진 후 계산된다.

  • float.MaxValue ~= 3.402823+e38
  • long.MaxValue ~= 9.223372+e18

(4월 28일 Update 2) 정밀도(precision)의 차이가 낮기 때문에 int, long에서 float 또는 long에서 double로 변환될 때 값이 손실 될 수 가 있다. 그러나 항상은 아님.

A widening conversion of an int or a long value to float, or of a long value to double, may result in loss of precision – that is, the result may lose some of the least significant bits of the value. In this case, the resulting floating-point value will be a correctly rounded version of the integer value, using IEEE 754 round-to-nearest mode (§4.2.4).


Tajo 개발 일지 시작

머리에만 의존하고 기록을 안하다 보니 스쳐 지나가는 아이디어나 버그 발견, TODO 리스트 정리가 쉽지 않다. 기록 자체가 생각 정리하는 좋은 방법이라는 것 또한 잘 알고 있지만 실천이 쉽지 않다.  사실 공책에 기록을 남기려 몇 차례 시도하였었다. 그러나 원채 필기하는 습관이 베지 않아 정리보다는 그때 그때 필요한 브레인 스토밍 북으로만 그치고 만다. 나중에 보면 무슨 내용인지 기억 안나는건 당연지사. 개인 위키에서 정리를 하려 시도해봤는데 혼자 보는 거니 그때 그 때 찾은 링크 몇개 남기고 만다. 이것 또한 기록이 체계적이지 않아 낭패…

그래서 Tajo 개발 일지를 블로그에 틈틈이 쓰려고 한다. 블로그에 써서 남들에게 읽혀지는게 다소 부담스럽기도 하지만 살짝의 부담이  체계적인 정리를 가능하게 할 것 같다.  또한 Tajo 자체에 대한 내용을 다루면서 레퍼런스나 기술적, 학술적인 내용을 담기게 될 것이기 때문에 블로그를 통해 누군가에게 유익한 정보가 될 수 도 있으리라. 그리고 블로그는 기록했던 정보를 내가 검색하기도 좋다.

어떤 내용을 어떻게 쓰는 것이 효과적인지는 아직 모르겠다. 차차 써가면서 이 것 또한 정리해 보자. Tajo에 대한 생각 정리나 기록이 우선 이지만 몇 년 지난 뒤에 다시 봤을 때의 즐거움도 은근 기대가 된다.