logo

한국어

포럼

몇가지 필요성 (EncodeKor -_-)에 의해 만들어진 프로그램입니다.

(CP949[ANSI], UTF-8, UTF-16LE, UTF-16BE) 텍스트 파일을 이 프로그램으로 '던져 넣으면'

각 글자마다 몇번씩 사용되었는지 출력해줍니다.



'16' 댓글

Hide_D

2010.05.29
03:08:27
(*.116.99.134)
이건 덤으로 이번 아랄 DB를 마루타 삼아서 긁어봤습니다.

대상으론 적절하겠네요.
첨부 :
db_100529.sql.result.txt [File Size:116.2KB/Download15]

Hide_D

2010.05.29
03:20:53
(*.116.99.134)
이건 위 텍스트 파일을 xls로 정리한것

즉, 폴라리스 커뮤니티에서 가장 많이 쓰이는 글자 목록 되겠습니다
첨부 :
db_100529_result.xls [File Size:299.0KB/Download11]

Hide_D

2010.05.29
03:32:11
(*.116.99.134)
다음은 기본 완성형 KS 1001 ( http://ko.wikipedia.org/wiki/KS_X_1001 )문자 목록과
기본 자음, 모음 목록 ( http://ko.wikipedia.org/wiki/%ED%95%9C%EA%B8%80 )
첨부 :
초중종.txt [File Size:272Bytes/Download12]
완성.txt [File Size:13.8KB/Download8]

Hide_D

2010.05.29
03:32:52
(*.116.99.134)
다음은 위의 SQL 분석표에 완성형과 기본 초중종성에 200000의 가중치를 더해 정렬한 데이터

이 결과로 따르자면, 한글 완성형 외 글자 중에서도 약 1400글자만 추가 수용 하는것으로
대부분의 문자를 표현할 수 있음을 알 수 있습니다.
첨부 :
output.txt [File Size:185.9KB/Download26]
test.cpp [File Size:821Bytes/Download6]

Hide_D

2010.07.07
17:16:00
(*.107.134.77)
CP932(Shift_JIS)와
CP949의

'전체 유효 문자' 목록

txt 파일은 기본 출력 파일에서 문자가 있다고 나오지만 실제로는 공백인 문자를 제외한 버전
첨부 :
KR_JP_Char.txt [File Size:476.1KB/Download102]
KR_JP_Character.cpp [File Size:871Bytes/Download12]

Hide_D

2010.07.07
17:19:04
(*.107.134.77)
CP949의 전체 목록

txt 파일은 정리된 것
첨부 :
KR_Map.cpp [File Size:393Bytes/Download19]
CP949.txt [File Size:102.5KB/Download14]

Hide_D

2010.07.07
17:30:37
(*.107.134.77)
JLPT 1급, 2급의 한자 목록

1급은 2,230자
2급은   986자

출처 : http://www.jlpt-kanji.com/
첨부 :
JLPT1.txt [File Size:4.4KB/Download15]
JLPT2.txt [File Size:1.9KB/Download9]

Hide_D

2010.07.07
19:21:18
(*.107.134.77)
추가로 긁어모은 한글 모음

빢삒똠찦뻒딬뵬봘쩗웪봥

Hide_D

2010.07.08
00:29:36
(*.107.134.77)
특수 문자 포함한 CP949 -> 부분 문자

이 문자들이 EncodeKor 변환 테이블에 사용됩니다.
현재 : 4084자

이후에 추가되는 문자는 정렬되지 않고 이 뒤로 이어집니다
첨부 :
KR_Complete.txt [File Size:8.0KB/Download24]

Hide_D

2010.07.08
02:20:12
(*.107.134.77)
Shift-JIS의 한자영역해서 JLPT 1급 한자를 제외한 부분

EncodeKor 변환 테이블에 사용됩니다.
첨부 :
JP_Complete.txt [File Size:8.8KB/Download24]

Hide_D

2010.07.08
17:53:13
(*.107.134.77)
완성된 0x8000 길이의 배열 두개
1:1 대응
첨부 :
JP_Map.txt [File Size:228.0KB/Download7]
KR_Map.txt [File Size:228.0KB/Download7]
MapMaker.zip [File Size:56.7KB/Download12]

Hide_D

2010.07.08
22:35:03
(*.107.134.77)
특수 문자를 1:1 대응해서 다시 제작한
KR_Complete.txt
JP_Complete.txt

KR_Map.txt
JP_Map.txt
첨부 :
JP_Complete.txt [File Size:9.7KB/Download33]
KR_Complete.txt [File Size:8.8KB/Download34]
JP_Map.txt [File Size:228.0KB/Download20]
KR_Map.txt [File Size:228.0KB/Download11]

Hide_D

2010.07.08
23:10:37
(*.107.134.77)
현재까지의 자료를 기반으로 완성된 EncodeKor, DecodeKor

Visual C++ 2010으로 제작되었으나 VC 6.0버전도 가능

위의 JP_Complete.txt KR_Complete.txt JP_Map.txt KR_Map.txt과 같은 기초 자료,
EncodeKor.h cpp 파일은 임의 개조 및 사용이 가능합니다.


100709 02:36 문자열 종결자 관련 버그 수정
첨부 :
EncodeKor.zip [File Size:27.9KB/Download36]

Hide_D

2010.07.09
03:04:26
(*.107.134.77)
EncodeKor에서 樮(뷁), 또는 浣(쀍)가 보인다면 문제가 있는 경우입니다.

Hide_D

2010.07.21
03:33:08
(*.107.134.77)
여기서 EncodeKor를 좀더 확장한다면
일본어 JLPT1급 한자 구역 <-> 한국 일반 한자 구역
의 매핑이 필요할 것 같습니다.

우선 http://ko.wikipedia.org/wiki/%EC%9D%BC%EB%B3%B8%EC%9D%98_%EC%83%81%EC%9A%A9%ED%95%9C%EC%9E%90_%EB%AA%A9%EB%A1%9D  (일본의 사용한자 목록)을 참고하여
변환을 시도할 계획입니다.

Hide_D

2010.10.25
09:55:31
(*.76.93.206)
JLPT1급 한자 <-> 한국 일반 한자 변환 결과
http://homepage3.nifty.com/jgrammar/ja/tools/tradkan.htm
이 홈페이지를 이용한 결과입니다.
첨부 :
JPT1_Cvt_Ko.txt [File Size:5.1KB/Download16]
JLPT1_Src.txt [File Size:4.9KB/Download5]
문서 첨부 제한 : 0Byte/ 10.00MB
파일 제한 크기 : 10.00MB (허용 확장자 : *.*)
옵션 :
:
:
:
:
List of Articles
번호 제목 글쓴이 날짜 조회 수
공지 Talk [필독] 테스트필터 사용시 주의사항 라파에 2008-08-03 120761
314 Talk 웹 계정 아이디/비밀번호 secret Hide_D 2011-01-02 1
313 Talk DenyWord + 정규표현식? Hide_D 2010-12-18 11308
312 Talk ATCode에 @가 붙은 글꼴을 빼버려야겠군요 Hide_D 2010-12-11 10888
311 Archive [소스, 플러그인] Cache 테스트버전 101127 file Hide_D 2010-11-27 14422
310 Talk KiriKiri 텍스트 파싱 개선 프로젝트! Hide_D 2010-10-28 16230
309 Talk [뻘글] 요새 프로텍터가 하도 무서워서 Hide_D 2010-10-26 16409
308 Talk JSCustom의 초기 골격 코드를 SVN에 커밋했습니다. [1] Hide_D 2010-09-18 25217
» OtherFiles EncodeKor(한국어 <-> 일본어 문자 코드 대치) 재 작성 프로젝트! [16] file Hide_D 2010-05-29 45604
306 Talk 아랄3 디버깅이 말이죠... [2] file JKLeetro 2010-04-20 26072
305 Talk ATCustom - 함수 Reference [47] Hide_D 2010-07-20 46957
304 Talk 쓸모가 있을것 같은 기능들 [4] Hide_D君 2008-07-30 14215
303 OtherFiles [프로그램] 필터 테스트 프로그램 [13] file Hide_D 2008-12-16 20885
302 Talk [0.2] OnPluginInit단에서 스레드를 만들 때 [회피법] Hide_D 2010-06-23 20337
301 Archive [플러그인] GoogleTrans 테스트 버전 (20100620) file Hide_D 2010-06-20 19519
300 OtherFiles [소스] Test Network + Google Translate Source - 2 file Hide_D 2010-06-19 19329
299 Talk Hide_D's Todo List Hide_D 2010-03-01 15207
298 OtherFiles AralTrans.exe 파일 살짝 수정했습니다. + 아랄씨 계시면 보세요 file Hide_D 2010-06-07 20792
297 Talk 번역 모듈로 인터넷을 이용하는 방법. Hide_D 2010-06-04 22118
296 Talk 6월 1일 2시 챗던 Talk Hide_D 2010-06-01 13587
295 OtherFiles [프로그램, 소스] AT 환경 수집기 20100526 file Hide_D 2010-05-26 22101