Home » គ្រីបតូ »

ការយល់ដឹងពីភាពជាប់ទាក់ទងគ្នា - ជាពិសេសការជាប់ទាក់ទងគ្នាទល់នឹងមូលហេតុ

ស្វែងយល់ពីកំហុសសំខាន់ៗក្នុងការបកស្រាយទំនាក់ទំនងទិន្នន័យ ហើយហេតុអ្វីបានជាការជាប់ទាក់ទងគ្នាមិនដូចគ្នាទៅនឹងមូលហេតុ។

តើ​អ្វី​ទៅ​ជា​ទំនាក់​ទំនង​ទល់​នឹង​បុព្វហេតុ?

នៅក្នុងពិភពនៃស្ថិតិ និងការវិភាគទិន្នន័យ ពាក្យ "ការជាប់ទាក់ទងគ្នា" និង "បុព្វហេតុ" ត្រូវបានគេប្រើជាញឹកញាប់ ប៉ុន្តែមានការយល់ច្រឡំជាញឹកញាប់។ ទោះបីជាវាហាក់ដូចជាស្រដៀងគ្នាក៏ដោយ ភាពខុសគ្នារវាងគំនិតទាំងពីរគឺមានសារៈសំខាន់ ជាពិសេសនៅពេលបកស្រាយការសិក្សាបរិមាណ ឬធ្វើការសម្រេចចិត្តផ្នែកហិរញ្ញវត្ថុ គោលនយោបាយ ឬយុទ្ធសាស្ត្រដោយផ្អែកលើទិន្នន័យ។

ទំនាក់ទំនង វាស់កម្រិតដែលអថេរពីរផ្លាស់ទីទាក់ទងគ្នាទៅវិញទៅមក។ វាត្រូវបានបញ្ជាក់ជាលេខរវាង -1 និង 1។ ការជាប់ទាក់ទងគ្នានៃ 1 បង្កប់ន័យទំនាក់ទំនងវិជ្ជមានដ៏ល្អឥតខ្ចោះ—ឧទាហរណ៍ នៅពេលដែលអថេរមួយកើនឡើង មួយទៀតក៏ដូចគ្នាដែរ។ ការជាប់ទាក់ទងគ្នានៃ -1 បង្កប់ន័យទំនាក់ទំនងអវិជ្ជមានដ៏ល្អឥតខ្ចោះ—អថេរមួយកើនឡើង ខណៈពេលដែលមួយទៀតថយចុះ។ ការជាប់ទាក់ទងគ្នានៃ 0 បង្ហាញថាមិនមានទំនាក់ទំនងលីនេអ៊ែររវាងអថេរនោះទេ។

បុព្វហេតុ ដែលត្រូវបានគេស្គាល់ផងដែរថាជា "បុព្វហេតុ" មានន័យថាការផ្លាស់ប្តូរនៅក្នុងអថេរមួយគឺទទួលខុសត្រូវចំពោះការផ្លាស់ប្តូរនៅក្នុងមួយផ្សេងទៀត។ ម្យ៉ាង​ទៀត ព្រឹត្តិការណ៍​មួយ​គឺ​ជា​លទ្ធផល​នៃ​ការ​កើត​ឡើង​នៃ​ព្រឹត្តិការណ៍​ផ្សេង​ទៀត—មាន​ទំនាក់ទំនង​ដែល​មាន​ឥទ្ធិពល​នៅ​ពេល​លេង។

វា​សំខាន់​ណាស់​ក្នុង​ការ​កត់​សម្គាល់៖ ការ​ជាប់​ទាក់ទង​គ្នា​មិន​បញ្ជាក់​ពី​មូលហេតុ។ ដោយ​សារ​តែ​អថេរ​ពីរ​បង្ហាញ​ទំនាក់ទំនង​ស្ថិតិ​មិន​មែន​មាន​ន័យ​ថា​មួយ​បង្ក​ឱ្យ​មាន​កត្តា​ផ្សេង​ទៀត​ទេ។ ពួកគេអាចជា៖

  • ទាក់ទងគ្នាដោយចៃដន្យ
  • ជំរុញដោយកត្តាលាក់កំបាំងទីបី (អ្នកបង្កើត)
  • ការវាស់វែងគោលគំនិតដូចគ្នា

សូមពិចារណាឧទាហរណ៍មួយដែលត្រូវបានលើកឡើងជាញឹកញាប់ដើម្បីបង្ហាញពីភាពលំបាកនេះ៖ ការលក់ការ៉េម និងឧប្បត្តិហេតុលង់ទឹកមានទំនាក់ទំនងជាវិជ្ជមាន។ ទោះជាយ៉ាងណាក៏ដោយនេះមិនមានន័យថាការទទួលទានការ៉េមបណ្តាលឱ្យលង់ទឹកនោះទេ។ ផ្ទុយទៅវិញ អថេរទីបី - អាកាសធាតុក្តៅ - ត្រូវបានផ្សារភ្ជាប់ជាមួយនឹងការលក់ការ៉េមខ្ពស់ និងមនុស្សហែលទឹកកាន់តែច្រើន ដូច្នេះឧប្បត្តិហេតុលង់ទឹកកាន់តែច្រើន។ ការបកស្រាយមិនត្រឹមត្រូវនៃទំនាក់ទំនងបែបនេះអាចនាំឱ្យមានការសន្និដ្ឋានខុស និងគោលការណ៍ណែនាំខុស។

ការយល់ច្រលំនេះគឺមានគ្រោះថ្នាក់ជាពិសេសនៅក្នុងវិស័យដូចជាថ្នាំពេទ្យ សេដ្ឋកិច្ច និងហិរញ្ញវត្ថុ ដែលការធ្វើសកម្មភាពលើទំនាក់ទំនងដែលយល់ឃើញដោយមិនបង្កើតមូលហេតុពិតអាចបង្កើតលទ្ធផលអាក្រក់។

ការ​យល់​ពី​ភាព​ខុស​គ្នា​ជួយ​ជៀស​វាង​ការ​សន្និដ្ឋាន​មិន​ច្បាស់លាស់ និង​គាំទ្រ​ការ​វិភាគ និង​ការ​សម្រេច​ចិត្ត​កាន់​តែ​ច្បាស់។

ការពន្យល់អំពីភាពជាប់ទាក់ទងគ្នាទូទៅ

ការ​យល់​ច្រឡំ​ទំនាក់ទំនង​ស្ថិតិ​ច្រើន​តែ​នាំ​ឱ្យ​មាន​កំហុស​ក្នុង​ការ​វិភាគ​ធ្ងន់ធ្ងរ។ ខាងក្រោម​នេះ យើង​ស្វែងយល់​ពី​បញ្ហា​ទូទៅ​ដែល​ទាក់ទង​នឹង​ការ​បកស្រាយ​ទំនាក់ទំនង និង​របៀប​ដែល​កត្តា​ទាំងនេះ​អាច​ប៉ះពាល់​ដល់​ដែន​ផ្សេងៗ​ពី​ការ​ស្រាវជ្រាវ​វិទ្យាសាស្ត្រ​ដល់​ការ​ព្យាករណ៍​អាជីវកម្ម។

1. ការជាប់ទាក់ទងគ្នាខុសសម្រាប់បុព្វហេតុ

នេះ​គឺ​ជា​បញ្ហា​ដ៏​សំខាន់​បំផុត​ដែល​អាច​ប្រកែក​បាន។ ដោយសារតែសំណុំទិន្នន័យពីរផ្លាស់ទីជាមួយគ្នាមិនបង្ហាញថាមួយមានឥទ្ធិពលលើមួយផ្សេងទៀត ជាឧទាហរណ៍ ប្រសិនបើការសិក្សាបង្ហាញថាសិស្សដែលយកអាហារថ្ងៃត្រង់ពីផ្ទះមកធ្វើការសិក្សាបានល្អជាង វាអាចជាការទាក់ទាញឱ្យសន្និដ្ឋានថាអាហារថ្ងៃត្រង់ដែលខ្ចប់មកផ្ទះធ្វើឱ្យលទ្ធផលសិក្សាកាន់តែប្រសើរ។ ទោះជាយ៉ាងណាក៏ដោយ ទំនាក់ទំនងអាចត្រូវបានជះឥទ្ធិពលដោយអថេរផ្សេងទៀតដូចជា សាវតាសេដ្ឋកិច្ចសង្គម រចនាប័ទ្មមាតាបិតា ឬការផ្តល់មូលនិធិពីសាលា។

2. មិនអើពើនឹងអថេរច្របូកច្របល់

Confounders គឺជាអថេរដែលលាក់ដែលប៉ះពាល់ដល់ទាំងអថេរអាស្រ័យ និងឯករាជ្យ ដែលអាចបង្កើតទំនាក់ទំនងមិនពិត ឬបំភាន់។ ជាឧទាហរណ៍ ទីក្រុងមួយអាចរកឃើញទំនាក់ទំនងរវាងទំហំស្បែកជើងខ្ពស់ចំពោះកុមារ និងអត្រាអក្ខរកម្មប្រសើរជាងមុន។ អថេរ​ដែល​មាន​ឥទ្ធិពល​ទាំង​ពីរ​អាច​ជា​អាយុ—ក្មេង​ចាស់​មាន​ជើង​ធំ ហើយ​ក៏​អាន​បាន​ល្អ​ដែរ។

៣. មើល​រំលង​ការ​ជាប់​ទាក់ទង​គ្នា​ដ៏​ស្វិតស្វាញ

ជួនកាល ទំនាក់ទំនងកើតឡើងដោយចៃដន្យ។ នេះជារឿងធម្មតាជាពិសេសនៅពេលដោះស្រាយជាមួយសំណុំទិន្នន័យធំ ឬអថេរជាច្រើន - ទំនាក់ទំនងមួយចំនួនត្រូវបានចងភ្ជាប់នឹងបង្ហាញជាស្ថិតិ ទោះបីជាមិនមានអត្ថន័យមូលហេតុក៏ដោយ។ គេហទំព័រដូចជា Spurious Correlations បង្ហាញឧទាហរណ៍បែបកំប្លែង ដូចជាការជាប់ទាក់ទងគ្នារវាងការប្រើប្រាស់ margarine និងអត្រាលែងលះនៅ Maine ដែលចៃដន្យជាជាងមានន័យ។

4. ភាពច្របូកច្របល់នៃទិសដៅ

ទោះបីជាទំនាក់ទំនងបុព្វហេតុមានក៏ដោយ ការជាប់ទាក់ទងគ្នាមិនបង្ហាញពីទិសដៅនៃបុព្វហេតុទេ។ ប្រសិនបើទិន្នន័យបង្ហាញថាអ្នកដែលគេងច្រើនមានទំនោរទៅទម្ងន់តិច វាមិនច្បាស់ទេថាតើការគេងច្រើននាំឱ្យការគ្រប់គ្រងទម្ងន់បានប្រសើរជាងមុន ឬថាតើមនុស្សដែលមានទម្ងន់មានសុខភាពល្អមានទំនោរគេងបានប្រសើរជាងមុន។

5. ភាពលំអៀងនៃការជីកយករ៉ែទិន្នន័យ

ជាមួយនឹងភាពជឿនលឿននៃបច្ចេកវិទ្យាទិន្នន័យធំ អ្នកវិភាគមានឧបករណ៍ដើម្បីពិនិត្យមើលសំណុំទិន្នន័យដ៏ធំសម្បើមក្នុងការស្វែងរកទំនាក់ទំនង។ ទោះជាយ៉ាងណាក៏ដោយ ដោយគ្មានសម្មតិកម្មដែលបានកំណត់ទុកជាមុន វាបង្កើនហានិភ័យនៃការស្វែងរកទំនាក់ទំនងដែលមានសារៈសំខាន់ជាស្ថិតិ ប៉ុន្តែមិនមានអត្ថន័យជាក់ស្តែង។ នេះត្រូវបានគេហៅថា "p-hacking" ។ ការជាប់ទាក់ទងគ្នាដែលបានរកឃើញនៅក្នុងលំហាត់បូមខ្សាច់ត្រូវតែមានសុពលភាពតាមរយៈវិធីសាស្ត្រពិសោធន៍យ៉ាងម៉ត់ចត់ ឬតាមបណ្តោយ។

6. បរាជ័យក្នុងការពិចារណាកត្តាពេលវេលា

ទំនាក់ទំនងអាចត្រូវបានបង្ខូចទ្រង់ទ្រាយ ប្រសិនបើទំនាក់ទំនងបណ្ដោះអាសន្នមិនត្រូវបានអើពើ។ ជាឧទាហរណ៍ តម្លៃភាគហ៊ុនអាចកើនឡើងបន្ទាប់ពីការចេញផ្សាយផលិតផលថ្មី ប៉ុន្តែនេះមិនបង្ហាញថាការចេញលក់ផលិតផលបណ្តាលឱ្យភាគហ៊ុនកើនឡើងនោះទេ។ កត្តាផ្សេងទៀតអាចកើតឡើងក្នុងពេលដំណាលគ្នា ឬមុននេះ។ អ្នក​វិភាគ​ត្រូវ​វាយ​តម្លៃ​ផល​ប៉ះពាល់​ដែល​យឺតយ៉ាវ និង​អាកប្បកិរិយា​ជា​ស៊េរី​ពេល​វេលា​ដើម្បី​ទាញ​ការ​សន្និដ្ឋាន​ត្រឹមត្រូវ។

ឧបាយកលទាំងនេះបញ្ជាក់ពីសារៈសំខាន់នៃការបកស្រាយដោយប្រុងប្រយ័ត្ន។ ការវិភាគស្ថិតិសំឡេងត្រូវតែលើសពីការជាប់ទាក់ទងគ្នាសាមញ្ញ និងរួមបញ្ចូលឧបករណ៍ និងបច្ចេកទេសដែលអាចបំបែកកត្តាបង្កហេតុ។

Cryptocurrencies ផ្តល់នូវសក្តានុពលត្រឡប់មកវិញខ្ពស់ និងសេរីភាពហិរញ្ញវត្ថុកាន់តែច្រើនតាមរយៈវិមជ្ឈការ ប្រតិបត្តិការនៅក្នុងទីផ្សារដែលបើកចំហ 24/7 ។ ទោះជាយ៉ាងណាក៏ដោយ ពួកវាជាទ្រព្យសម្បត្តិដែលមានហានិភ័យខ្ពស់ដោយសារតែការប្រែប្រួលខ្លាំង និងកង្វះបទប្បញ្ញត្តិ។ ហានិភ័យចម្បងរួមមានការខាតបង់ឆាប់រហ័ស និងការបរាជ័យផ្នែកសុវត្ថិភាពតាមអ៊ីនធឺណិត។ គន្លឹះនៃភាពជោគជ័យគឺការវិនិយោគតែជាមួយយុទ្ធសាស្រ្តច្បាស់លាស់ និងជាមួយដើមទុនដែលមិនប៉ះពាល់ដល់ស្ថិរភាពហិរញ្ញវត្ថុរបស់អ្នក។

Cryptocurrencies ផ្តល់នូវសក្តានុពលត្រឡប់មកវិញខ្ពស់ និងសេរីភាពហិរញ្ញវត្ថុកាន់តែច្រើនតាមរយៈវិមជ្ឈការ ប្រតិបត្តិការនៅក្នុងទីផ្សារដែលបើកចំហ 24/7 ។ ទោះជាយ៉ាងណាក៏ដោយ ពួកវាជាទ្រព្យសម្បត្តិដែលមានហានិភ័យខ្ពស់ដោយសារតែការប្រែប្រួលខ្លាំង និងកង្វះបទប្បញ្ញត្តិ។ ហានិភ័យចម្បងរួមមានការខាតបង់ឆាប់រហ័ស និងការបរាជ័យផ្នែកសុវត្ថិភាពតាមអ៊ីនធឺណិត។ គន្លឹះនៃភាពជោគជ័យគឺការវិនិយោគតែជាមួយយុទ្ធសាស្រ្តច្បាស់លាស់ និងជាមួយដើមទុនដែលមិនប៉ះពាល់ដល់ស្ថិរភាពហិរញ្ញវត្ថុរបស់អ្នក។

របៀបកំណត់បុព្វហេតុពិត

ការយល់ដឹងអំពីបុព្វហេតុទាមទារឱ្យមានវិធីសាស្រ្តជាវិធីសាស្ត្រដែលលើសពីទំនាក់ទំនងស្ថិតិ។ នេះគឺជាបច្ចេកទេស និងក្របខ័ណ្ឌមួយចំនួនដែលអ្នកវិភាគ និងអ្នកស្រាវជ្រាវអាចប្រើដើម្បីស៊ើបអង្កេត និងបញ្ជាក់ទំនាក់ទំនងមូលហេតុ៖

1. ការសាកល្បងដែលគ្រប់គ្រងដោយចៃដន្យ (RCTs)

RCTs គឺជាស្តង់ដារមាសក្នុងការបង្កើតបុព្វហេតុ។ នៅក្នុងវិធីសាស្រ្តនេះ អ្នកចូលរួមត្រូវបានចាត់តាំងដោយចៃដន្យទៅក្រុមព្យាបាល ឬក្រុមត្រួតពិនិត្យ ដោយជួយលុបបំបាត់អថេរដែលបំភ័ន្ត និងញែកផលប៉ះពាល់ជាក់លាក់នៃអន្តរាគមន៍។ ទោះបីជាជារឿងធម្មតានៅក្នុងឱសថក៏ដោយ RCTs ត្រូវបានអនុវត្តកាន់តែខ្លាំងឡើងនៅក្នុងការស្រាវជ្រាវសេដ្ឋកិច្ច និងគោលនយោបាយសាធារណៈផងដែរ។

2. ការសិក្សាបណ្តោយ

មិនដូចការសិក្សាផ្នែកឆ្លងកាត់ដែលផ្តល់រូបថតនៅចំណុចមួយក្នុងពេលនោះទេ ការសិក្សាតាមបណ្តោយសង្កេតមុខវិជ្ជាក្នុងរយៈពេលយូរ។ វាជួយក្នុងការបង្កើតទំនាក់ទំនងបណ្ដោះអាសន្នដែលត្រូវការដើម្បីសន្និដ្ឋានអំពីបុព្វហេតុ—ធានាថាបណ្តាលឱ្យមានផលប៉ះពាល់មុន។

៣. អថេរ​ឧបករណ៍

វិធីសាស្ត្រស្ថិតិនេះត្រូវបានប្រើនៅពេលដែលការចៃដន្យមិនអាចធ្វើទៅបាន។ អថេរឧបករណ៍ប៉ះពាល់ដល់អថេរឯករាជ្យ ប៉ុន្តែមិនមានទំនាក់ទំនងផ្ទាល់ជាមួយអថេរអាស្រ័យលើសពីនោះទេ។ ឧបករណ៍​នេះ​ជួយ​ញែក​ឥទ្ធិពល​មូលហេតុ​ពិតប្រាកដ​នៅ​ក្នុង​ចំណោម​ទិន្នន័យ​ស្មុគស្មាញ។

4. ភាពខុសគ្នាក្នុងភាពខុសគ្នា (DiD)

ត្រូវបានប្រើជាទូទៅក្នុងការវាយតម្លៃគោលនយោបាយ និងសេដ្ឋកិច្ច ឌីឌី ប្រៀបធៀបការផ្លាស់ប្តូរលទ្ធផលក្នុងរយៈពេលរវាងក្រុមព្យាបាល និងក្រុមត្រួតពិនិត្យ។ វាគ្រប់គ្រងសម្រាប់អថេរដែលមិនបានសង្កេត ដែលអាចបង្ខូចទ្រង់ទ្រាយសាមញ្ញមុន និងក្រោយការវិភាគ។

5. បុព្វហេតុ Granger

នៅក្នុងការព្យាករណ៍ជាស៊េរីពេលវេលា បុព្វហេតុ Granger សាកល្បងថាតើអថេរមួយព្យាករណ៍តាមស្ថិតិមួយផ្សេងទៀតតាមពេលវេលាដែរឬទេ។ ទោះបីជាមិនមែនជាភស្តុតាងច្បាស់លាស់នៃបុព្វហេតុក៏ដោយ វាជាឧបករណ៍វិនិច្ឆ័យដ៏មានប្រយោជន៍សម្រាប់ភាពអាស្រ័យបណ្ដោះអាសន្ននៅក្នុងទិន្នន័យសេដ្ឋកិច្ច។

6. លក្ខណៈវិនិច្ឆ័យនៃបុព្វហេតុរបស់ភ្នំ

បង្កើតឡើងដោយអ្នកជំនាញខាងរោគរាតត្បាតលោក Sir Austin Bradford Hill នេះផ្តល់នូវសំណុំនៃគោលការណ៍ចំនួនប្រាំបួន រួមមាន ភាពរឹងមាំ ភាពជាប់លាប់ ភាពជាក់លាក់ ភាពបណ្តោះអាសន្ន និងជម្រាលជីវសាស្រ្ត ដែលណែនាំអ្នកវិទ្យាសាស្ត្រក្នុងការវាយតម្លៃតំណមូលហេតុ។

7. ការប្រើក្រាហ្វអាស៊ីក្លីកដែលដឹកនាំ (DAGs)

DAGs គឺជាតំណាងដែលមើលឃើញនៃការសន្មត់អំពីទំនាក់ទំនងបុព្វហេតុរវាងអថេរ។ ទាំងនេះមានប្រយោជន៍ជាពិសេសក្នុងការកំណត់អត្តសញ្ញាណអ្នកបង្រួបបង្រួមដែលមានសក្តានុពល អ្នកសម្របសម្រួល និងរង្វិលជុំមតិយោបល់នៅក្នុងប្រព័ន្ធស្មុគស្មាញ។

8. ឧបសគ្គខាងសីលធម៌ និងការអនុវត្ត

នៅក្នុងវិស័យជាច្រើន ការធ្វើ RCTs ឬរៀបចំមូលហេតុដែលអាចកើតមាន ប្រហែលជាមិនមានក្រមសីលធម៌ ឬអាចធ្វើទៅបានទេ។ បន្ទាប់មកអ្នកស្រាវជ្រាវត្រូវតែពឹងផ្អែកលើទិន្នន័យសង្កេតដែលមានគុណភាពខ្ពស់ រួមផ្សំជាមួយវិធីសាស្ត្រស្ថិតិដ៏រឹងមាំ ដើម្បីគាំទ្រការអះអាងពីមូលហេតុ។ តម្លាភាពក្នុងការសន្មត់ និងការកំណត់នៅទីនេះគឺសំខាន់ណាស់។

សេចក្តីសន្និដ្ឋាន៖ ខណៈពេលដែលទំនាក់ទំនងស្ថិតិមានភាពងាយស្រួលក្នុងការគណនា ហើយជារឿយៗអាចទាក់ទាញភ្នែកបាន ការបង្ហាញពីមូលហេតុគឺស្មុគស្មាញជាង។ ការយល់ដឹង និងការអនុវត្តឧបករណ៍ដ៏រឹងមាំដើម្បីបែងចែករវាងការជាប់ទាក់ទងគ្នា និងការបង្កហេតុគឺមានសារៈសំខាន់សម្រាប់ការយល់ដឹងដ៏ត្រឹមត្រូវ និងការសម្រេចចិត្តប្រកបដោយការទទួលខុសត្រូវនៅក្នុងដែនដែលជំរុញដោយទិន្នន័យណាមួយ។

វិនិយោគឥឡូវនេះ >>