top of page

Machine learning สำหรับ Quant Investment

Machine learning สร้างผลกระทบที่ยิ่งใหญ่ไปทุกอุตสาหกรรมไม่เว้นแม้กระทั้งอุตสาหกรรมจัดการลงทุน เราสามารถนำ Machine learning  มาประยุกต์ใช้รวมถึงบทบาทจะมีความสำคัญเพิ่มขึ้น มันจะสร้างความสามารถในการแข่งขันสำหรับผู้ที่นำ ML มาใช้ในทางกลับกันผู้ที่ต่อต้านและไม่เรียนรู้ถึงศักยภาพของ ML มีแนวโน้มจะร่วมชะตากรรมกับ Kodak


ML กับการลงทุน

ปัญหาทางการเงินเป็นความท้าทายอย่างยิ่งเนื่องจากระบบเศรษฐกิจแสดงระดับความซับซ้อนจนทำให้เข้าใจได้ยากมาก แต่การที่พัฒนาการของคอมพิวเตอร์ทำให้วิธีการในการวิเคราะห์ทางสถิติเปลี่ยนไป วิธีการที่ซับซ้อนอย่าง cross-validation, ensemble estimators, regularization, bootstrapping, หรือ Monte Carlo ทำให้ได้รับผลลัพธ์ที่ดีกว่าการวิเคราะห์การลงทุนแบบดั่งเดิม

แต่เดี๋ยวก่อนเราไม่ใช่จะปฏิเสธทฤษฎีทางการเงินทั้งหมดแล้วหมกหมุ่นกับ ML หรือมั่วแต่ใช้ backtest กลยุทธ์การลงทุนในอดีตโดยไม่สนใจอะไร แต่จุดมุ่งหมายของเราคือเราจะใช้ ML เพื่อสร้างทฤษฎีทางการเงินที่ดีขึ้น เพราะว่าทฤษฎีสามารถบอกถึงกลไกของเหตุและผลของสิ่งที่เกิดขึ้นมันไม่มีประโยชน์อะไรเลยหากคุณสร้างกลยุทธ์การลงทุนที่ดีแต่ไม่สามารถอธิบายถึงหลักการให้ใครฟังได้เลย

backtesting ไม่ใช่เครื่องมือวิจัย backtesting เป็นเพียงเครื่องมือที่จะทดสอบกลยุทธ์กับข้อมูลในอดีต(เราไม่มีข้อมูลในอนาคตตอนนี้นิ) กลยุทธ์การลงทุนต้องได้รับการสนับสนุนจากทฤษฏีเท่านั้น


เราสามารถใช้ ML เพื่อค้นหาตัวแปรที่ซ่อนอยู่ซึ่งเกี่ยวข้องกับปรากฏการณ์ที่ซับซ้อนแล้วเราก็สามารถกำหนดทฤษฎีที่เชื่อมโยงส่วนผสมเหล่านี้ผ่านโครงสร้างในระบบสมการที่ตั้งสมมติฐานเกี่ยวกับกลไกของเหตุและผลโดยเฉพาะ เมื่อทฤษฎีได้รับการทดสอบแล้ว เราสามารถนำทฤษฎีไปใช้ได้เมื่อทฤษฎีถูกค้นพบแล้ว อัลกอริทึม ML จะไม่มีบทบาทในการตัดสินใจ การใช้ ML ในด้านการเงินอย่างชาญฉลาดที่สุดคือการค้นพบทฤษฎีต่างๆ คุณสามารถใช้ ML เพื่อคาดการณ์ทางการเงินได้สำเร็จ อย่างไรก็ตาม นั่นไม่ใช่การใช้เทคโนโลยีนี้ในเชิงวิทยาศาสตร์ที่ดีที่สุด (โดยเฉพาะอย่างยิ่งหากเป้าหมายของคุณคือการพัฒนากลยุทธ์การลงทุน

  1. Existence:ML ถูกนำมาใช้เพื่อประเมินความน่าเชื่อถือของทฤษฎีในสาขาวิทยาศาสตร์ทั้งหมด แม้แต่นอกเหนือไปจากวิทยาศาสตร์เชิงประจักษ์ โดยเฉพาะอย่างยิ่ง อัลกอริทึม ML ช่วยให้ค้นพบทางคณิตศาสตร์ อัลกอริธึม ML ไม่สามารถพิสูจน์ทฤษฎีบทได้ แต่สามารถชี้ไปที่การมีอยู่ของทฤษฎีบทที่ยังไม่ถูกค้นพบ ซึ่งสามารถคาดเดาและพิสูจน์ได้ในที่สุด กล่าวอีกนัยหนึ่ง หากสามารถทำนายบางสิ่งได้ ก็มีความหวังว่าจะสามารถเปิดเผยกลไกได้

  2. Importance: อัลกอริทึม ML สามารถหาความสัมพัทธ์ของตัวแปร เพื่อวัตถุประสงค์ในการอธิบายและ/หรือการทำนาย

  3. Causation: ML algorithms สามารถประยุกต์ใช้ในการหาสาเหตุรวมถึงผลกระทบของเหตุการณ์ต่างๆ

  4. Reductionist:เทคนิค ML สามารถปรับขนาดของข้อมูลที่มีหลายมิติและซับซ้อนให้เข้าใจได้ง่ายขึ้นทำให้แยกความแตกต่างนั้นสามารถวิเคราะห์ได้

  5. Retriever:ML ใช้ในการสแกนผ่านข้อมูลขนาดใหญ่เพื่อค้นหารูปแบบที่มนุษย์ไม่รู้จักเช่นการตรวจจับค่าผิดปกติ

Overfitting

Overfitting เกิดได้ 2 ลักษณะ ได้แก่ Overfitting ที่เกิดจากข้อมูลฝึก และ Overfitting ที่เกิดจากข้อมูลทดสอบ

Train Set Overfitting

Train set overfitting เกิดจาก noise ซึ่งเรามี 3 วิธีในการจัดการ

  1. ประเมินข้อผิดพลาดทั่วไปโดยใช้เทคนิคการสุ่มใหม่(cross-validation) และ Monte Carlo

  2. regularization methods ใช้วิธี ที่รวมการคาดคะเนของโมเดลหลาย ๆ แบบเพื่อปรับปรุงประสิทธิภาพโดยรวมของโมเดล เทคนิคเหล่านี้สามารถใช้เพื่อจัดการกับชุดการฝึกมากเกินไป ซึ่งเกิดขึ้นเมื่อแบบจำลองมีความซับซ้อนมากเกินไป และเรียนรู้รายละเอียดและสัญญาณรบกวนในข้อมูลการฝึก ซึ่งนำไปสู่การสรุปข้อมูลใหม่ที่ไม่ดี

  3. Ensemble techniques เป็นเทคนิคที่สามารถใช้เพื่อลด overfitting ในโมเดลแมชชีนเลิร์นนิงโดยการเพิ่มคำลงโทษในฟังก์ชันวัตถุประสงค์ที่โมเดลพยายามปรับให้เหมาะสม เงื่อนไขการลงโทษส่งเสริมให้โมเดลมีน้ำหนักน้อยลง ซึ่งสามารถช่วยป้องกันไม่ให้โมเดลเรียนรู้สัญญาณรบกวนในข้อมูลการฝึก

Test Set Overfitting

นักวิจัยที่ทำการทดสอบทางสถิติหลายครั้งในชุดข้อมูลเดียวกันก็มีแนวโน้มที่จะค้นพบข้อมูลที่ผิดพลาด การใช้การทดสอบเดียวกันกับชุดข้อมูลเดียวกันหลายๆ ครั้ง รับประกันได้ว่าในที่สุดนักวิจัยจะทำการค้นพบที่ผิดพลาด ความลำเอียงในการเลือกนี้มาจากการปรับโมเดลให้ทำงานได้ดีในชุดทดสอบ ไม่ใช่ชุดรถไฟ

อีกตัวอย่างหนึ่งของการ overfitting ชุดทดสอบเกิดขึ้นเมื่อนักวิจัยทดสอบกลยุทธ์ย้อนหลัง และเธอปรับแต่งจนกว่าผลลัพธ์จะบรรลุประสิทธิภาพตามเป้าหมาย วงจร backtest-tweak-backtest นั้นเป็นแบบฝึกหัดที่ไร้ประโยชน์ซึ่งจะจบลงด้วยกลยุทธ์ overfit อย่างหลีกเลี่ยงไม่ได้ (ผลบวกลวง) นักวิจัยควรใช้เวลาของเธอในการสืบสวนว่ากระบวนการวิจัยทำให้เธอเข้าใจผิดในการทดสอบกลยุทธ์ที่ผิดพลาดย้อนหลังได้อย่างไร กล่าวอีกนัยหนึ่ง backtest ที่มีประสิทธิภาพต่ำคือโอกาสในการแก้ไขกระบวนการวิจัย ไม่ใช่โอกาสในการแก้ไขกลยุทธ์การลงทุน

สิ่งที่คนเข้าใจผิดในการใช้ ML ในการลงทุน

  1. ML ทำได้ทุกอย่าง: เรามักได้ยินข้อมูลที่เกินจริงของ ML ทำให้คนส่วนใหญ่เชื่อว่าทำได้ทุกอย่าง ML แต่แท้จริงแล้ว ML ก็มีข้อจำกัดไม่ได้แก้ได้ทุกปัญหาขนาดนั้น

  2. ML Is a Black Box: อีกหนึ่งความเชื่อที่เข้าใจผิดคือ ML เป็นกล่องดำไม่สามารถอธิบายได้ แต่แท้จริงแล้ว ML สามารถให้ข้อมูลเชิงลึกได้มากกว่าวิธีการทางสถิติแบบดั้งเดิม (รวมถึงเศรษฐมิติ) โมเดล ML สามารถตีความได้ผ่านหลายขั้นตอน

  3. ข้อมูลทางการเงินไม่พอต่อการใช้ ML: อัลกอริธึม ML บ้างอันอาจจำเป็นต้องใช้ข้อมูลจำนวนมาก แต่ML จำนวนมากในด้านการเงินไม่ต้องการข้อมูลในอดีตเยอะขนาดนั้น หรือไม่ต้องการเลยเช่น การวิเคราะห์ความเสี่ยง การสร้างพอร์ตโฟลิโอ การตรวจจับค่าผิดปกติ ความสำคัญของคุณลักษณะ

  4. มีข้อมูลรบกวนเยอะ: ความเป็นจริงแล้วข้อมูลทางการเงินมี Noise ต่ำกว่าชุดที่ใช้โดยแอปพลิเคชัน ML อื่นๆ


อนาคตของการวิจัยทางการเงิน

ข้อมูลส่วนใหญ่ในโลกเป็นข้อมูลแบบไม่มีโครงสร้าง เทคนิคเชิงปริมาณแบบดั้งเดิมอาจล้มเหลวในการจับความสัมพันธ์ที่อาจซับซ้อน (เช่น ความไม่เชิงเส้นและการโต้ตอบ) ระหว่างตัวแปร และเทคนิคเหล่านี้มีความละเอียดอ่อนอย่างยิ่งต่อปัญหาหลายกลุ่มเชิงเส้นที่แผ่ซ่านไปทั่วชุดข้อมูลทางการเงิน

บริษัทด้านการลงทุนเชิงปริมาณที่ประสบความสำเร็จมากที่สุดในประวัติศาสตร์พึ่งพา ML เป็นหลัก ไม่ใช่เศรษฐมิติ และปัจจุบันเศรษฐมิติที่มีความโดดเด่นในการศึกษาระดับบัณฑิตศึกษาได้เตรียมนักศึกษาให้พร้อมสำหรับการประกอบอาชีพด้านวิชาการ ไม่ใช่งานในอุตสาหกรรม

นี่ไม่ได้หมายความว่าเศรษฐมิติมีอายุการใช้งานยาวนานกว่า นักวิจัยที่ถูกขอให้ตัดสินใจระหว่างเศรษฐมิติและ ML นั้นถูกนำเสนอด้วยตัวเลือกที่ผิด ML และเศรษฐมิติเสริมซึ่งกันและกัน เพราะมีจุดแข็งที่แตกต่างกัน ตัวอย่างเช่น ML สามารถเป็นประโยชน์อย่างยิ่งในการแนะนำส่วนประกอบของทฤษฎีแก่นักวิจัย และเศรษฐมิติจะเป็นประโยชน์ในการทดสอบทฤษฎีที่มีพื้นฐานมาจากการสังเกตเชิงประจักษ์ ในความเป็นจริง บางครั้งเราอาจต้องการใช้ทั้งสองกระบวนทัศน์พร้อมกัน เช่น ในวิธีกึ่งพารามิเตอร์ ตัวอย่างเช่น การถดถอยอาจรวมตัวแปรอธิบายที่สังเกตได้เข้ากับตัวแปรควบคุมที่สนับสนุนโดยอัลกอริทึม ML

ส่งท้าย

จุดประสงค์ขององค์ประกอบนี้คือเพื่อแนะนำเครื่องมือ ML ที่มีประโยชน์สำหรับการค้นพบทฤษฎีทางเศรษฐศาสตร์และการเงิน กลยุทธ์การลงทุนที่ประสบความสำเร็จคือการนำทฤษฎีทั่วไปไปใช้อย่างเฉพาะเจาะจง กลยุทธ์การลงทุนที่ขาดเหตุผลทางทฤษฎีมักจะเป็นเท็จ ดังนั้น นักวิจัยควรมุ่งความสนใจไปที่การพัฒนาทฤษฎีมากกว่าการทดสอบกลยุทธ์ที่เป็นไปได้ย้อนหลัง ML ไม่ใช่กล่องดำ และไม่จำเป็นต้องเกินพอดี เครื่องมือ ML ช่วยเสริมแทนที่จะแทนที่วิธีการทางสถิติแบบดั้งเดิม จุดแข็งบางประการของ ML ได้แก่ (1) มุ่งเน้นไปที่ความสามารถในการคาดการณ์นอกกลุ่มตัวอย่างมากกว่าการตัดสินผลต่าง ๆ; (2) การใช้วิธีการคำนวณเพื่อหลีกเลี่ยงการพึ่งพาสมมติฐาน (ที่อาจไม่สมจริง) (3) ความสามารถในการ “เรียนรู้” ข้อกำหนดที่ซับซ้อน รวมถึงเอฟเฟกต์การโต้ตอบแบบไม่เชิงเส้น ลำดับชั้น และไม่ต่อเนื่องในพื้นที่มิติสูง และ (4) ความสามารถในการแยกแยะการค้นหาตัวแปรออกจากการค้นหาข้อมูลจำเพาะ ในลักษณะที่แข็งแกร่งต่อ multicollinearity และเอฟเฟกต์การแทนที่อื่น ๆ

0 ความคิดเห็น

Comments


bottom of page