ស្វែងយល់ពីរបៀបដែលការបញ្ជាទិញមានកម្រិតដំណើរការ ពេលណាត្រូវប្រើវា និងរបៀបដែលវាអាចជួយអ្នកក្នុងការគ្រប់គ្រងតម្លៃប្រតិបត្តិ និងគ្រប់គ្រងហានិភ័យនៅក្នុងទីផ្សារដែលងាយនឹងបង្កជាហេតុ។
ការយល់ដឹងពីភាពជាប់ទាក់ទងគ្នា - ជាពិសេសការជាប់ទាក់ទងគ្នាទល់នឹងមូលហេតុ
ស្វែងយល់ពីកំហុសសំខាន់ៗក្នុងការបកស្រាយទំនាក់ទំនងទិន្នន័យ ហើយហេតុអ្វីបានជាការជាប់ទាក់ទងគ្នាមិនដូចគ្នាទៅនឹងមូលហេតុ។
តើអ្វីទៅជាទំនាក់ទំនងទល់នឹងបុព្វហេតុ?
នៅក្នុងពិភពនៃស្ថិតិ និងការវិភាគទិន្នន័យ ពាក្យ "ការជាប់ទាក់ទងគ្នា" និង "បុព្វហេតុ" ត្រូវបានគេប្រើជាញឹកញាប់ ប៉ុន្តែមានការយល់ច្រឡំជាញឹកញាប់។ ទោះបីជាវាហាក់ដូចជាស្រដៀងគ្នាក៏ដោយ ភាពខុសគ្នារវាងគំនិតទាំងពីរគឺមានសារៈសំខាន់ ជាពិសេសនៅពេលបកស្រាយការសិក្សាបរិមាណ ឬធ្វើការសម្រេចចិត្តផ្នែកហិរញ្ញវត្ថុ គោលនយោបាយ ឬយុទ្ធសាស្ត្រដោយផ្អែកលើទិន្នន័យ។
ទំនាក់ទំនង វាស់កម្រិតដែលអថេរពីរផ្លាស់ទីទាក់ទងគ្នាទៅវិញទៅមក។ វាត្រូវបានបញ្ជាក់ជាលេខរវាង -1 និង 1។ ការជាប់ទាក់ទងគ្នានៃ 1 បង្កប់ន័យទំនាក់ទំនងវិជ្ជមានដ៏ល្អឥតខ្ចោះ—ឧទាហរណ៍ នៅពេលដែលអថេរមួយកើនឡើង មួយទៀតក៏ដូចគ្នាដែរ។ ការជាប់ទាក់ទងគ្នានៃ -1 បង្កប់ន័យទំនាក់ទំនងអវិជ្ជមានដ៏ល្អឥតខ្ចោះ—អថេរមួយកើនឡើង ខណៈពេលដែលមួយទៀតថយចុះ។ ការជាប់ទាក់ទងគ្នានៃ 0 បង្ហាញថាមិនមានទំនាក់ទំនងលីនេអ៊ែររវាងអថេរនោះទេ។
បុព្វហេតុ ដែលត្រូវបានគេស្គាល់ផងដែរថាជា "បុព្វហេតុ" មានន័យថាការផ្លាស់ប្តូរនៅក្នុងអថេរមួយគឺទទួលខុសត្រូវចំពោះការផ្លាស់ប្តូរនៅក្នុងមួយផ្សេងទៀត។ ម្យ៉ាងទៀត ព្រឹត្តិការណ៍មួយគឺជាលទ្ធផលនៃការកើតឡើងនៃព្រឹត្តិការណ៍ផ្សេងទៀត—មានទំនាក់ទំនងដែលមានឥទ្ធិពលនៅពេលលេង។
វាសំខាន់ណាស់ក្នុងការកត់សម្គាល់៖ ការជាប់ទាក់ទងគ្នាមិនបញ្ជាក់ពីមូលហេតុ។ ដោយសារតែអថេរពីរបង្ហាញទំនាក់ទំនងស្ថិតិមិនមែនមានន័យថាមួយបង្កឱ្យមានកត្តាផ្សេងទៀតទេ។ ពួកគេអាចជា៖
- ទាក់ទងគ្នាដោយចៃដន្យ
- ជំរុញដោយកត្តាលាក់កំបាំងទីបី (អ្នកបង្កើត)
- ការវាស់វែងគោលគំនិតដូចគ្នា
សូមពិចារណាឧទាហរណ៍មួយដែលត្រូវបានលើកឡើងជាញឹកញាប់ដើម្បីបង្ហាញពីភាពលំបាកនេះ៖ ការលក់ការ៉េម និងឧប្បត្តិហេតុលង់ទឹកមានទំនាក់ទំនងជាវិជ្ជមាន។ ទោះជាយ៉ាងណាក៏ដោយនេះមិនមានន័យថាការទទួលទានការ៉េមបណ្តាលឱ្យលង់ទឹកនោះទេ។ ផ្ទុយទៅវិញ អថេរទីបី - អាកាសធាតុក្តៅ - ត្រូវបានផ្សារភ្ជាប់ជាមួយនឹងការលក់ការ៉េមខ្ពស់ និងមនុស្សហែលទឹកកាន់តែច្រើន ដូច្នេះឧប្បត្តិហេតុលង់ទឹកកាន់តែច្រើន។ ការបកស្រាយមិនត្រឹមត្រូវនៃទំនាក់ទំនងបែបនេះអាចនាំឱ្យមានការសន្និដ្ឋានខុស និងគោលការណ៍ណែនាំខុស។
ការយល់ច្រលំនេះគឺមានគ្រោះថ្នាក់ជាពិសេសនៅក្នុងវិស័យដូចជាថ្នាំពេទ្យ សេដ្ឋកិច្ច និងហិរញ្ញវត្ថុ ដែលការធ្វើសកម្មភាពលើទំនាក់ទំនងដែលយល់ឃើញដោយមិនបង្កើតមូលហេតុពិតអាចបង្កើតលទ្ធផលអាក្រក់។
ការយល់ពីភាពខុសគ្នាជួយជៀសវាងការសន្និដ្ឋានមិនច្បាស់លាស់ និងគាំទ្រការវិភាគ និងការសម្រេចចិត្តកាន់តែច្បាស់។
ការពន្យល់អំពីភាពជាប់ទាក់ទងគ្នាទូទៅ
ការយល់ច្រឡំទំនាក់ទំនងស្ថិតិច្រើនតែនាំឱ្យមានកំហុសក្នុងការវិភាគធ្ងន់ធ្ងរ។ ខាងក្រោមនេះ យើងស្វែងយល់ពីបញ្ហាទូទៅដែលទាក់ទងនឹងការបកស្រាយទំនាក់ទំនង និងរបៀបដែលកត្តាទាំងនេះអាចប៉ះពាល់ដល់ដែនផ្សេងៗពីការស្រាវជ្រាវវិទ្យាសាស្ត្រដល់ការព្យាករណ៍អាជីវកម្ម។
1. ការជាប់ទាក់ទងគ្នាខុសសម្រាប់បុព្វហេតុ
នេះគឺជាបញ្ហាដ៏សំខាន់បំផុតដែលអាចប្រកែកបាន។ ដោយសារតែសំណុំទិន្នន័យពីរផ្លាស់ទីជាមួយគ្នាមិនបង្ហាញថាមួយមានឥទ្ធិពលលើមួយផ្សេងទៀត ជាឧទាហរណ៍ ប្រសិនបើការសិក្សាបង្ហាញថាសិស្សដែលយកអាហារថ្ងៃត្រង់ពីផ្ទះមកធ្វើការសិក្សាបានល្អជាង វាអាចជាការទាក់ទាញឱ្យសន្និដ្ឋានថាអាហារថ្ងៃត្រង់ដែលខ្ចប់មកផ្ទះធ្វើឱ្យលទ្ធផលសិក្សាកាន់តែប្រសើរ។ ទោះជាយ៉ាងណាក៏ដោយ ទំនាក់ទំនងអាចត្រូវបានជះឥទ្ធិពលដោយអថេរផ្សេងទៀតដូចជា សាវតាសេដ្ឋកិច្ចសង្គម រចនាប័ទ្មមាតាបិតា ឬការផ្តល់មូលនិធិពីសាលា។
2. មិនអើពើនឹងអថេរច្របូកច្របល់
Confounders គឺជាអថេរដែលលាក់ដែលប៉ះពាល់ដល់ទាំងអថេរអាស្រ័យ និងឯករាជ្យ ដែលអាចបង្កើតទំនាក់ទំនងមិនពិត ឬបំភាន់។ ជាឧទាហរណ៍ ទីក្រុងមួយអាចរកឃើញទំនាក់ទំនងរវាងទំហំស្បែកជើងខ្ពស់ចំពោះកុមារ និងអត្រាអក្ខរកម្មប្រសើរជាងមុន។ អថេរដែលមានឥទ្ធិពលទាំងពីរអាចជាអាយុ—ក្មេងចាស់មានជើងធំ ហើយក៏អានបានល្អដែរ។
៣. មើលរំលងការជាប់ទាក់ទងគ្នាដ៏ស្វិតស្វាញ
ជួនកាល ទំនាក់ទំនងកើតឡើងដោយចៃដន្យ។ នេះជារឿងធម្មតាជាពិសេសនៅពេលដោះស្រាយជាមួយសំណុំទិន្នន័យធំ ឬអថេរជាច្រើន - ទំនាក់ទំនងមួយចំនួនត្រូវបានចងភ្ជាប់នឹងបង្ហាញជាស្ថិតិ ទោះបីជាមិនមានអត្ថន័យមូលហេតុក៏ដោយ។ គេហទំព័រដូចជា Spurious Correlations បង្ហាញឧទាហរណ៍បែបកំប្លែង ដូចជាការជាប់ទាក់ទងគ្នារវាងការប្រើប្រាស់ margarine និងអត្រាលែងលះនៅ Maine ដែលចៃដន្យជាជាងមានន័យ។
4. ភាពច្របូកច្របល់នៃទិសដៅ
ទោះបីជាទំនាក់ទំនងបុព្វហេតុមានក៏ដោយ ការជាប់ទាក់ទងគ្នាមិនបង្ហាញពីទិសដៅនៃបុព្វហេតុទេ។ ប្រសិនបើទិន្នន័យបង្ហាញថាអ្នកដែលគេងច្រើនមានទំនោរទៅទម្ងន់តិច វាមិនច្បាស់ទេថាតើការគេងច្រើននាំឱ្យការគ្រប់គ្រងទម្ងន់បានប្រសើរជាងមុន ឬថាតើមនុស្សដែលមានទម្ងន់មានសុខភាពល្អមានទំនោរគេងបានប្រសើរជាងមុន។
5. ភាពលំអៀងនៃការជីកយករ៉ែទិន្នន័យ
ជាមួយនឹងភាពជឿនលឿននៃបច្ចេកវិទ្យាទិន្នន័យធំ អ្នកវិភាគមានឧបករណ៍ដើម្បីពិនិត្យមើលសំណុំទិន្នន័យដ៏ធំសម្បើមក្នុងការស្វែងរកទំនាក់ទំនង។ ទោះជាយ៉ាងណាក៏ដោយ ដោយគ្មានសម្មតិកម្មដែលបានកំណត់ទុកជាមុន វាបង្កើនហានិភ័យនៃការស្វែងរកទំនាក់ទំនងដែលមានសារៈសំខាន់ជាស្ថិតិ ប៉ុន្តែមិនមានអត្ថន័យជាក់ស្តែង។ នេះត្រូវបានគេហៅថា "p-hacking" ។ ការជាប់ទាក់ទងគ្នាដែលបានរកឃើញនៅក្នុងលំហាត់បូមខ្សាច់ត្រូវតែមានសុពលភាពតាមរយៈវិធីសាស្ត្រពិសោធន៍យ៉ាងម៉ត់ចត់ ឬតាមបណ្តោយ។
6. បរាជ័យក្នុងការពិចារណាកត្តាពេលវេលា
ទំនាក់ទំនងអាចត្រូវបានបង្ខូចទ្រង់ទ្រាយ ប្រសិនបើទំនាក់ទំនងបណ្ដោះអាសន្នមិនត្រូវបានអើពើ។ ជាឧទាហរណ៍ តម្លៃភាគហ៊ុនអាចកើនឡើងបន្ទាប់ពីការចេញផ្សាយផលិតផលថ្មី ប៉ុន្តែនេះមិនបង្ហាញថាការចេញលក់ផលិតផលបណ្តាលឱ្យភាគហ៊ុនកើនឡើងនោះទេ។ កត្តាផ្សេងទៀតអាចកើតឡើងក្នុងពេលដំណាលគ្នា ឬមុននេះ។ អ្នកវិភាគត្រូវវាយតម្លៃផលប៉ះពាល់ដែលយឺតយ៉ាវ និងអាកប្បកិរិយាជាស៊េរីពេលវេលាដើម្បីទាញការសន្និដ្ឋានត្រឹមត្រូវ។
ឧបាយកលទាំងនេះបញ្ជាក់ពីសារៈសំខាន់នៃការបកស្រាយដោយប្រុងប្រយ័ត្ន។ ការវិភាគស្ថិតិសំឡេងត្រូវតែលើសពីការជាប់ទាក់ទងគ្នាសាមញ្ញ និងរួមបញ្ចូលឧបករណ៍ និងបច្ចេកទេសដែលអាចបំបែកកត្តាបង្កហេតុ។
របៀបកំណត់បុព្វហេតុពិត
ការយល់ដឹងអំពីបុព្វហេតុទាមទារឱ្យមានវិធីសាស្រ្តជាវិធីសាស្ត្រដែលលើសពីទំនាក់ទំនងស្ថិតិ។ នេះគឺជាបច្ចេកទេស និងក្របខ័ណ្ឌមួយចំនួនដែលអ្នកវិភាគ និងអ្នកស្រាវជ្រាវអាចប្រើដើម្បីស៊ើបអង្កេត និងបញ្ជាក់ទំនាក់ទំនងមូលហេតុ៖
1. ការសាកល្បងដែលគ្រប់គ្រងដោយចៃដន្យ (RCTs)
RCTs គឺជាស្តង់ដារមាសក្នុងការបង្កើតបុព្វហេតុ។ នៅក្នុងវិធីសាស្រ្តនេះ អ្នកចូលរួមត្រូវបានចាត់តាំងដោយចៃដន្យទៅក្រុមព្យាបាល ឬក្រុមត្រួតពិនិត្យ ដោយជួយលុបបំបាត់អថេរដែលបំភ័ន្ត និងញែកផលប៉ះពាល់ជាក់លាក់នៃអន្តរាគមន៍។ ទោះបីជាជារឿងធម្មតានៅក្នុងឱសថក៏ដោយ RCTs ត្រូវបានអនុវត្តកាន់តែខ្លាំងឡើងនៅក្នុងការស្រាវជ្រាវសេដ្ឋកិច្ច និងគោលនយោបាយសាធារណៈផងដែរ។
2. ការសិក្សាបណ្តោយ
មិនដូចការសិក្សាផ្នែកឆ្លងកាត់ដែលផ្តល់រូបថតនៅចំណុចមួយក្នុងពេលនោះទេ ការសិក្សាតាមបណ្តោយសង្កេតមុខវិជ្ជាក្នុងរយៈពេលយូរ។ វាជួយក្នុងការបង្កើតទំនាក់ទំនងបណ្ដោះអាសន្នដែលត្រូវការដើម្បីសន្និដ្ឋានអំពីបុព្វហេតុ—ធានាថាបណ្តាលឱ្យមានផលប៉ះពាល់មុន។
៣. អថេរឧបករណ៍
វិធីសាស្ត្រស្ថិតិនេះត្រូវបានប្រើនៅពេលដែលការចៃដន្យមិនអាចធ្វើទៅបាន។ អថេរឧបករណ៍ប៉ះពាល់ដល់អថេរឯករាជ្យ ប៉ុន្តែមិនមានទំនាក់ទំនងផ្ទាល់ជាមួយអថេរអាស្រ័យលើសពីនោះទេ។ ឧបករណ៍នេះជួយញែកឥទ្ធិពលមូលហេតុពិតប្រាកដនៅក្នុងចំណោមទិន្នន័យស្មុគស្មាញ។
4. ភាពខុសគ្នាក្នុងភាពខុសគ្នា (DiD)
ត្រូវបានប្រើជាទូទៅក្នុងការវាយតម្លៃគោលនយោបាយ និងសេដ្ឋកិច្ច ឌីឌី ប្រៀបធៀបការផ្លាស់ប្តូរលទ្ធផលក្នុងរយៈពេលរវាងក្រុមព្យាបាល និងក្រុមត្រួតពិនិត្យ។ វាគ្រប់គ្រងសម្រាប់អថេរដែលមិនបានសង្កេត ដែលអាចបង្ខូចទ្រង់ទ្រាយសាមញ្ញមុន និងក្រោយការវិភាគ។
5. បុព្វហេតុ Granger
នៅក្នុងការព្យាករណ៍ជាស៊េរីពេលវេលា បុព្វហេតុ Granger សាកល្បងថាតើអថេរមួយព្យាករណ៍តាមស្ថិតិមួយផ្សេងទៀតតាមពេលវេលាដែរឬទេ។ ទោះបីជាមិនមែនជាភស្តុតាងច្បាស់លាស់នៃបុព្វហេតុក៏ដោយ វាជាឧបករណ៍វិនិច្ឆ័យដ៏មានប្រយោជន៍សម្រាប់ភាពអាស្រ័យបណ្ដោះអាសន្ននៅក្នុងទិន្នន័យសេដ្ឋកិច្ច។
6. លក្ខណៈវិនិច្ឆ័យនៃបុព្វហេតុរបស់ភ្នំ
បង្កើតឡើងដោយអ្នកជំនាញខាងរោគរាតត្បាតលោក Sir Austin Bradford Hill នេះផ្តល់នូវសំណុំនៃគោលការណ៍ចំនួនប្រាំបួន រួមមាន ភាពរឹងមាំ ភាពជាប់លាប់ ភាពជាក់លាក់ ភាពបណ្តោះអាសន្ន និងជម្រាលជីវសាស្រ្ត ដែលណែនាំអ្នកវិទ្យាសាស្ត្រក្នុងការវាយតម្លៃតំណមូលហេតុ។
7. ការប្រើក្រាហ្វអាស៊ីក្លីកដែលដឹកនាំ (DAGs)
DAGs គឺជាតំណាងដែលមើលឃើញនៃការសន្មត់អំពីទំនាក់ទំនងបុព្វហេតុរវាងអថេរ។ ទាំងនេះមានប្រយោជន៍ជាពិសេសក្នុងការកំណត់អត្តសញ្ញាណអ្នកបង្រួបបង្រួមដែលមានសក្តានុពល អ្នកសម្របសម្រួល និងរង្វិលជុំមតិយោបល់នៅក្នុងប្រព័ន្ធស្មុគស្មាញ។
8. ឧបសគ្គខាងសីលធម៌ និងការអនុវត្ត
នៅក្នុងវិស័យជាច្រើន ការធ្វើ RCTs ឬរៀបចំមូលហេតុដែលអាចកើតមាន ប្រហែលជាមិនមានក្រមសីលធម៌ ឬអាចធ្វើទៅបានទេ។ បន្ទាប់មកអ្នកស្រាវជ្រាវត្រូវតែពឹងផ្អែកលើទិន្នន័យសង្កេតដែលមានគុណភាពខ្ពស់ រួមផ្សំជាមួយវិធីសាស្ត្រស្ថិតិដ៏រឹងមាំ ដើម្បីគាំទ្រការអះអាងពីមូលហេតុ។ តម្លាភាពក្នុងការសន្មត់ និងការកំណត់នៅទីនេះគឺសំខាន់ណាស់។
សេចក្តីសន្និដ្ឋាន៖ ខណៈពេលដែលទំនាក់ទំនងស្ថិតិមានភាពងាយស្រួលក្នុងការគណនា ហើយជារឿយៗអាចទាក់ទាញភ្នែកបាន ការបង្ហាញពីមូលហេតុគឺស្មុគស្មាញជាង។ ការយល់ដឹង និងការអនុវត្តឧបករណ៍ដ៏រឹងមាំដើម្បីបែងចែករវាងការជាប់ទាក់ទងគ្នា និងការបង្កហេតុគឺមានសារៈសំខាន់សម្រាប់ការយល់ដឹងដ៏ត្រឹមត្រូវ និងការសម្រេចចិត្តប្រកបដោយការទទួលខុសត្រូវនៅក្នុងដែនដែលជំរុញដោយទិន្នន័យណាមួយ។
អ្នកអាចសប្បាយរីករាយនឹងនេះផងដែរ