PDF Direct 기술
PDF는 일반적으로 편집할 수 없습니다. 즉, PDF 파일을 번역하려면 매우 복잡한 과정을 거쳐야 하며, 비용 또한 많이 발생합니다. PDF Direct는 이러한 문제를 기술적으로 해결하여 PDF파일에서 자동으로 텍스트를 추출하는 것 뿐만 아니라 번역된 텍스트를 PDF 원본에 직접 삽입하여 원본과 동일한 포맷의 번역 PDF를 제공합니다.
WiseTranslate.net에서 PDF 파일을 번역 요청할 때 PDF Direct 기술을 사용할 것인지 일반 텍스트 추출을 사용할 것인지 선택할 수 있습니다.
PDF Direct는 텍스트 추출, OCR(이미지 판독), 번역 PDF 재구성 등 특수한 기술을 사용합니다. PDF Direct는 유료 서비스입니다. 비용에 대한 자세한 사항은 번역 비용을 참고하십시오.
PDF Direct 사용 방법
PDF Direct는 별도의 서버 프로세싱이 필요하여 번역 주문시 몇 단계의 절차가 필요합니다.
- PDF 파일 업로드 후 PDF Direct 옵션 선택
- <서버> 서버에서 PDF 파일 추출이 완료되면 이메일로 통보
- 이메일 확인 후 사이트 접속하여 번역 요청
- <서버> 번역 완료 후 PDF 번역 파일 재구성 작업 완료 후 이메일 통보
- 이메일 확인 후 사이트 접속하여 번역 파일 다운로드
스캔 PDF는 OCR 판독을 통해 텍스트를 추출합니다. OCR 판독 품질은 뛰어나지만 문단을 적절하게 구분하지 못하는 경우가 많아서 자동 번역 적용시 기대 수준 이하의 결과가 나오는 경우가 많습니다. OCR은 자동 번역에 적합하지 않습니다.
PDF Direct를 이용한 MT 번역 샘플
일반 텍스트로 MT 번역한 경우
PDF Direct를 사용하지 않고 "일반 텍스트"로 번역하면 아래와 같이 텍스트 파일로 전달됩니다.
PDF 번역 파일 폰트 설정
번역이 완료된 후 PDF에 번역 텍스트를 삽입하고 최종 번역 PDF를 재구성하는 과정에서 폰트 설정이 필요합니다. PDF는 폰트가 포함(embedding)되어 있는데, 원본 PDF에 사용된 글자 폰트만 포함되어 있어서 번역 언어에 필요한 폰트는 별도로 지정해 주어야 합니다. 이 과정은 저희 엔지니어가 직접 처리해야 하는 관계로 시간이 다소 소요될 수 있습니다.
번역 언어의 폰트는 Arial, 굴림 등 기본적인 폰트로 대체됩니다. 기본 폰트로 대체할 수 없는 특수 문자나 기호 또는 일부 언어의 폰트는 지원되지 않을 수 있으며, 저희가 제공할 수 없는 폰트 적용이 필요한 경우 사용자가 해당 폰트를 제공해야 합니다. 폰트 적용은 사람이 직접 처리해야하는 업무여서 별도의 비용이 발생할 수 있습니다.