มหัศจรรย์เหรียญกับข้อมูล - Thailand Times

Breaking

Post Top Ad

Saturday, 1 June 2024

มหัศจรรย์เหรียญกับข้อมูล

 มหัศจรรย์เหรียญกับข้อมูล

เหรียญเป็นสิ่งที่มนุษย์สร้างขึ้นมา มันอยู่ในทุกๆ ที่เพื่อใช้ในการซื้อขายสินค้าและมันอาจจะอยู่ในกระเป๋าของใครหลายๆคนในตอนนี้ เมื่อเราหยิบมันขึ้นมาดูเราอาจจะเห็นมันด้านหัวหรือก้อยด้วยโอกาสเท่าๆ กัน 


โลกปัจจุบันนี้มนุษย์พยายามเก็บรวบรวมข้อมูลเพื่อตอบคำถามที่ตัวเองอยากรู้ เหรียญอาจจะเป็นเครื่องมือสำหรับใช้ในการอธิบายข้อมูล บทความนี้จะเปิดเผยความเชื่อมโยงระหว่างสองสิ่งนี้


จำนวนเหตุการณ์ที่เกิดขึ้นในช่วงเวลาหนึ่ง เช่น จำนวนระดับการเปลี่ยนแปลงของอัตราแลกเปลี่ยนเงินตรา จำนวนผู้ทำผิดกฎหมายยาเสพติด เป็นต้น อาจจะเทียบได้กับจำนวนหงายหัวเมื่อโยนเหรียญจำนวนมหาศาลครั้งในช่วงเวลาหนึ่ง เพราะฉะนั้นจำนวนเหตุการณ์ (หงายหัว) ในช่วงเวลาหนึ่งที่เป็นไปได้คือ 0, 1, 2, 3, … 


เพื่อความเข้าใจที่มากขึ้น เราจะทดลองโยนเหรียญที่มีโอกาสเกิดหัวน้อยกว่าเกิดก้อย ที่แตกต่างกัน 3 รูปแบบ การทดลองจะโยนเหรียญจำนวนมหาศาลครั้งในช่วงเวลาหนึ่งและทำซ้ำเป็นจำนวนมหาศาลครั้ง ผลลัพธ์แสดงดังภาพด้านล่าง 

รูปที่ 1 สร้างจากการโยนเหรียญเพียงเหรียญเดียว หมายถึงการโยนเหรียญเพื่อให้เกิดหัวครั้งที่ 1, 2, 3 และครั้งอื่นๆ จะใช้เหรียญเดิม สิ่งที่เห็นได้จากการทดลองนี้จำนวนการเกิดหัวสองครั้งมีจำนวนมากที่สุด (แท่งเลขสองสูงสุดเมื่อเทียบกับแท่งอื่น)  

รูปที่ 2 สร้างจากการโยนเหรียญสองเหรียญที่แตกต่างกัน เหรียญแรกมีโอกาสเกิดหัวน้อยกว่าเหรียญที่สอง เหรียญที่สองจะถูกใช้เมื่อเกิดหัวแล้วหนึ่งครั้งและหลังจากเกิดหัวแล้วสองครั้งจะใช้เหรียญแรกตลอดไป การทดลองนี้จำนวนการเกิดหัวสองครั้งมากกว่าการทดลองแรก (แท่งเลขสองรูปนี้สูงกว่ารูปแรก) 

รูปที่ 3 สร้างจากสองเหรียญเช่นเดียวกับรูปที่ 2 แต่เหรียญแรกมีโอกาสเกิดหัวมากกว่าเหรียญที่สอง เหรียญที่สองจะถูกใช้เมื่อเกิดหัวแล้วสองครั้งและหลังจากเกิดหัวแล้วสามครั้งจะใช้เหรียญแรกตลอดไป จะเห็นว่าการทดลองนี้จำนวนการเกิดหัวสองครั้งมีมากกว่ารูปที่ 2


อาจมีใครสักคนถามว่าจะมีข้อมูลจำนวนการเกิดเหตุการณ์ในโลกของความเป็นจริงที่มีรูปลักษณะที่เข้ากันได้กับรูปใดรูปหนึ่งในสามรูปนี้ไหม ข้อมูลด้านล่างอาจจะตอบคำถามนี้ 

รูปที่ 4 คือข้อมูลจำนวนบุตรของผู้หญิงกลุ่มหนึ่งในประเทศเยอรมัน (Winkelmann (1995), McShane et al. (2008), Skulpakdee and Hunkrajok (2022), Hunkrajok and Skulpakdee (2024)) เราจะสังเกตได้ว่ารูปนี้คล้ายกับรูปที่ 3 มาก ดังนั้นเราอาจจะอธิบายพฤติกรรมของผู้หญิงกลุ่มนี้ได้ว่า ทำไมจำนวนผู้หญิงที่มีลูก 2 คนมีมากที่สุด (แท่งเลขสองสูงอย่างมีนัย) เพราะว่าผู้หญิงกลุ่มนี้ไม่อยากมีลูกคนที่สาม (เหรียญที่ใช้ในการสร้างเหตุการณ์ที่สามมีความน่าจะเป็นในการเกิดหัวน้อยกว่าเหรียญแรก) เนื่องจากรูปที่ 4 เข้ากันได้ไม่ดีกับรูปที่ 2 ดังนั้นเราไม่ควรแปลความหมายข้อมูลจำนวนบุตรนี้ว่าแท่งเลขสองสูง เนื่องจากผู้หญิงกลุ่มนี้อยากมีลูกคนที่สองมากกว่าลูกคนอื่น 


เหรียญเป็นเครื่องมือที่อัศจรรย์มากในการวิเคราะห์ข้อมูลและมันก็คงถูกใช้ในงานด้านนี้ไปอีกนานแสนนาน


เอกสารอ้างอิง

Winkelmann R (1995) Duration dependence and dispersion in count-data models. J Bus Econ Stat 13(4):467–474. https://www.jstor.org/stable/1392392


McShane B, Adrian M, Bradlow ET et al (2008) Count models based on Weibull interarrival times. J Bus

Econ Stat 26(3):369–378. https://www.jstor.org/stable/27638995


Skulpakdee W, Hunkrajok M (2022) Unusual-event processes for count data. SORT Stat Oper Res Trans 46(1):39–66. https://doi.org/10.2436/20.8080.02.117


Hunkrajok M, Skulpakdee W (2024) A simple algorithm for computing the probabilities of count models based on pure birth processes. Comput Stat 1-24. https://doi.org/10.1007/s00180-024-01491-4




ผศ. ดร. วรรณฤดี สกุลภักดี

สาขาวิชาสถิติศาสตร์

สาขาวิชาพลเมืองวิทยาการข้อมูล

สาขาวิชาวิทยาการประกันภัยและการบริหารความเสี่ยง

คณะสถิติประยุกต์

สถาบันบัณฑิตพัฒนบริหารศาสตร์


No comments:

Post a Comment

Post Bottom Ad


Pages