ภาพรวม
ทุกทีมเทคโนโลยี freight ต้องตอบคำถามนี้ในที่สุด: เราควรสร้างระบบ document parsing ของเราเองหรือซื้อ? คำตอบขึ้นอยู่กับปริมาณงาน ความสามารถทางเทคนิค และความอดทนของคุณต่อการบำรุงรักษาอย่างต่อเนื่อง บทเรียนนี้แจกแจงขอบเขต ต้นทุน และภาระการบำรุงรักษาที่แท้จริงเพื่อช่วยให้คุณตัดสินใจได้อย่างมีข้อมูล
สปอยล์: ทีมส่วนใหญ่ประเมินต้นทุนต่ำไปจำนวนมาก ไม่ใช่ตอนสร้าง แต่ตอนบำรุงรักษา OCR engine สามารถสร้างต้นแบบได้ภายในสัปดาห์ แต่ต้องใช้ทีม 2-3 คนในการดำเนินงาน production-grade ในเอกสาร freight เนื่องจากความหลากหลายของรูปแบบ ภาษา และการเปลี่ยนแปลงกฎระเบียบ
ขั้นตอนที่ 1 — ขอบเขต: 29 ส่วน FWB และ 170+ ฟิลด์
IATA FWB (Freight Waybill) message มี 29 ส่วน ตั้งแต่รายละเอียด AWB consignment ไปจนถึงข้อมูลศุลกากร ประกาศค่าใช้จ่าย ข้อมูลสินค้าอันตราย และข้อมูลอ้างอิง แต่ละส่วนมีกฎรูปแบบเฉพาะ ฟิลด์ตามเงื่อนไข และ edge cases ฟิลด์ทั้งหมดมากกว่า 170 ฟิลด์
นอกจากนี้ แต่ละสายการบินมีรูปแบบของตัวเอง เอกสาร AWB กระดาษจาก Thai Airways ดูต่างจาก Singapore Airlines Emirates หรือ Cathay Pacific ตำแหน่ง layout ขนาดฟอนต์ และกฎ field-population แตกต่างกัน คุณต้องสร้าง template หรือ model สำหรับทุกสายการบินที่คุณจะรองรับ ด้วยสายการบินกว่า 300 แห่งทั่วโลก นี่คือโปรเจ็กต์ที่ยาวนาน
ขั้นตอนที่ 2 — ต้นทุน: OCR Engine, ข้อมูลฝึก และภาษาไทย
การสร้าง AWB parser ต้องการส่วนประกอบราคาแพงหลายอย่าง อันดับแรก commercial OCR engine เช่น Google Vision AWS Textract หรือ Azure Document Intelligence มีค่าใช้จ่ายตั้งแต่ 1 ถึง 10 บาทต่อหน้าขึ้นอยู่กับปริมาณ อันดับสอง ข้อมูลฝึกอบรม คุณต้องการ AWB ที่มี label กว่า 10,000 ฉบับเพื่อฝึก field extraction model จริงจัง งาน labeling มีค่าใช้จ่ายประมาณ 50-100 บาทต่อเอกสาร (500,000-1,000,000 บาทเฉพาะ labeling)
อันดับสาม การรองรับภาษาไทย OCR มาตรฐานไม่ทำงานกับข้อความไทยบนเอกสาร freight คุณต้องการ Thai-specific OCR models address parsing สำหรับลำดับชั้นจังหวัด/อำเภอ/ตำบล และ transliteration ส่วนประกอบเหล่านี้แต่ละอย่างต้องใช้ข้อมูลฝึกอบรมและความเชี่ยวชาญเฉพาะ คาดว่าใช้เวลาพัฒนา 6-12 เดือนสำหรับ parsing pipeline ขั้นต่ำที่ใช้งานได้
ขั้นตอนที่ 3 — การบำรุงรักษา: การเปลี่ยนรูปแบบ สายการบินใหม่ ข้อกำหนด
การสร้างเริ่มต้นเป็นเพียงจุดเริ่มต้น รูปแบบ AWB เปลี่ยนเมื่อสายการบินอัปเดต template ซึ่งเกิดขึ้น 2-5 ครั้งต่อปีต่อสายการบิน IATA ปรับปรุงมาตรฐาน Cargo-IMP เป็นระยะ ล่าสุดคือ FWB/17 ที่กำลังจะมา ข้อกำหนดศุลกากรไทยเปลี่ยนอย่างน้อยปีละครั้ง ทุกการเปลี่ยนแปลงต้องการอัปเดต parser ทดสอบ และ deploy
สายการบินใหม่ต้องการ template หรือ model ใหม่ หากคุณเพิ่มเส้นทางใหม่ที่ใช้สายการบินที่คุณยังไม่รองรับ นั่นคืองานพัฒนา 2-4 สัปดาห์ สะสมรวมกัน การบำรุงรักษา AWB parser ต้องการ 1-2 นักพัฒนาเต็มเวลา ที่เงินเดือน Thai developer 60,000-100,000 บาทต่อเดือน นั่นคือ 720,000-2,400,000 บาทต่อปีในค่าบำรุงรักษาเพียงอย่างเดียว ก่อนนับค่า infrastructure
สรุป
การสร้าง AWB parser ของคุณเองเป็นงานสำคัญ: 170+ ฟิลด์ใน 29 ส่วน layout เฉพาะสายการบิน การรองรับภาษาไทย และการปฏิบัติตามข้อกำหนด IATA อย่างต่อเนื่อง ต้นทุนเริ่มต้นเริ่มที่ 2-5 ล้านบาทและต้นทุนบำรุงรักษาอยู่ที่ 1-2.4 ล้านบาทต่อปี
สำหรับทีมส่วนใหญ่ การซื้อเป็นตัวเลือกที่ถูกต้อง managed API เช่น KabyTech จัดการ OCR validation และ maintenance ให้คุณสามารถมุ่งเน้นธุรกิจ freight ของคุณ สร้างเมื่อ: คุณมีทีม ML เฉพาะ ปริมาณมากกว่า 10,000 เอกสารต่อวัน และข้อกำหนด compliance เฉพาะที่ API สาธารณะไม่สามารถรองรับ สำหรับคนอื่นทั้งหมด ROI ของ managed API ชนะอย่างชัดเจน
ข้ามขั้นตอนการสร้าง — เริ่มแยกวิเคราะห์วันนี้
KabyTech จัดการ OCR การตรวจสอบ และการบำรุงรักษาเพื่อให้คุณมุ่งเน้นธุรกิจขนส่งสินค้าของคุณ