![]() |
|---|
| ការកំណត់ទិន្នន័យ - Sketchnote ដោយ @nitya |
ទិន្នន័យគឺជាតុល្យភាពពិត ឆែកមើល និងការវាស់វែងដែលប្រើសម្រាប់រកឃើញ និងគាំទ្រការសម្រេចចិត្តមានដំណឹង។ ពិន្ទុទិន្នន័យមួយគឺជាឯកតាតែមួយនៃទិន្នន័យក្នុងលំដាប់ទិន្នន័យមួយ ដែលជាការប្រមូលផ្តុំគ្រប់ពិន្ទុទិន្នន័យ ។ លំដាប់ទិន្នន័យអាចមានទ្រង់ទ្រាយ និងរចនាសម្ព័ន្ធខុសគ្នា ហើយភាគច្រើនអាស្រ័យលើប្រភពរបស់វា ឬកន្លែងដែលទិន្នន័យមកពី។ ឧទាហរណ៍ អំណោយខែរបស់ក្រុមហ៊ុនអាចនៅក្នុងសន្លឹកប៉ារ៉ាហ្វតមួយ ប៉ុន្តែទិន្នន័យអត្រាព្រោះបេះដូងម៉ោងពីនាវាតណឹមខ្លះអាចនៅក្នុងទ្រង់ទ្រាយ JSON ។ វាជារឿងធម្មតាដែលអ្នកវិទ្យាសាស្ត្រទិន្នន័យធ្វើការជាមួយប្រភេទទិន្នន័យខុសៗគ្នាក្នុងលំដាប់ទិន្នន័យវិញ។
មេរៀននេះផ្ដោតលើការកំណត់ និងចំណាត់ថ្នាក់ទិន្នន័យដោយលក្ខណៈ និងប្រភពរបស់វា។
ទិន្នន័យដើមគឺជាទិន្នន័យដែលបានមកពីប្រភពរបស់វានៅសភាពដើម និងមិនទាន់បានវិភាគ ឬរៀបចំឡើយ។ ដើម្បីយល់ថាតើអ្វីកំពុងកើតឡើងជាមួយលំដាប់ទិន្នន័យ អ្នកត្រូវរៀបចំវាទៅក្នុងទ្រង់ទ្រាយដែលមនុស្ស និងបច្ចេកវិទ្យាដែលពួកគេប្រើអាចយល់បានច្រើនបន្ថែមទៀត។ រចនាសម្ព័ន្ធរបស់លំដាប់ទិន្នន័យពិពណ៌នាថាតើវាត្រូវបានរៀបចំយ៉ាងដូចម្តេច ហើយអាចចំណាត់ថ្នាក់ជា រចនាសម្ព័ន្ធ, មិនរចនាសម្ព័ន្ធ និង អមដោយរចនាសម្ព័ន្ធ។ ប្រភេទរចនាសម្ព័ន្ធទាំងនេះនឹងខុសគ្នា អាស្រ័យលើប្រភព ប៉ុន្តែចុងក្រោយនឹងសម្របគ្នានៅក្នុងបីប្រភេទនេះ។
ទិន្នន័យកំណិតគឺជាការពិចារណាលេខនៅក្នុងលំដាប់ទិន្នន័យ ហើយភាគច្រើនអាចវិភាគ វាស់វែង និងប្រើគណិតវិទ្យា។ ឧទាហរណ៍នៃទិន្នន័យកំណិតរួមមាន៖ ប្រជាជនប៉ុណ្ណុម្នាក់របស់ប្រទេស មនុស្សម្នាក់កម្ពស់ ឬប្រាក់ចំណូលត្រីមាសរបស់ក្រុមហ៊ុនមួយ។ ជាមួយការវិភាគបន្ថែម ទិន្នន័យកំណិតអាចប្រើសម្រាប់រកទំនុំរដូវរបស់ទិន្នន័យគុណភាពខ្យល់ (AQI) ឬគណនាការព្យាករណ៍នៃចរន្តចរាចរណ៍ម៉ោងកំពុងត្រូវក្នុងថ្ងៃធ្វើការ។
ទិន្នន័យគុណលក្ខណៈដែលគេហៅថា ទិន្នន័យចំណាត់ថ្នាក់ គឺជាទិន្នន័យដែលមិនអាចវាស់វែងដោយអOBJECTIVES ដូចជាការពិចារណាទិន្នន័យកំណិត។ វាជាទូទៅជា ទិន្នន័យដែលមានទម្រង់ច្រើននៃទិន្នន័យមានទម្រង់បុគ្គលដែលចាប់យកគុណភាពនៃអ្វីមួយ ដូចជាផលិតផល ឬដំណើរការ។ ម្តងម្ដង ទិន្នន័យគុណលក្ខណៈអាចជាអក្សរគណនា មិនត្រូវបានប្រើគណិតវិទ្យារួមដូចជាលេខទូរស័ព្ទឬពេលវេលា។ ឧទាហរណ៍នៃទិន្នន័យគុណលក្ខណៈមាន៖ មតិយោបល់វីដេអូ ម៉ាក និងម៉ូឌែលរថយន្ត ឬពណ៌ដែលមិត្តភក្តិជិតស្និទ្ធចូលចិត្ត។ ទិន្នន័យគុណលក្ខណៈអាចប្រើសម្រាប់យល់ថាផលិតផលណាដែលអ្នកប្រើប្រាស់ចូលចិត្តបំផុត ឬកំណត់ពាក្យគន្លឹះមានប្រជាប្រិយក្នុងប្រវត្តិរូបការងារ។
ទិន្នន័យរចនាសម្ព័ន្ធគឺជាទិន្នន័យដែលរៀបចំជាគ្រាប់ជួរក និងជួរឈរ ដែលជួរដែលមួយនឹងមានជួរឈរដដែលគ្នា។ ជួរឈរតំណាងឱ្យតម្លៃមួយប្រភេទ ហើយនឹងត្រូវបានកំណត់ជាមួយឈ្មោះមួយបញ្ជាក់ថាតម្លៃនេះតំណាងអ្វី ខណៈដែលជួរក្នុងមានតម្លៃពិតប្រាកដ។ ជួរឈរមានច្បាប់ ឬការរឹតត្បិតលើតម្លៃនេះដើម្បីធានាថាតម្លៃតំណាងបានត្រឹមត្រូវ។ ឧទាហរណ៍ ចូរត្រួតសន្លឹកអតិថិជនដែលជួរមួយត្រូវមានលេខទូរស័ព្ទ ហើយលេខទូរស័ព្ទមិនមានអក្សរទេទេ។ អាចមានច្បាប់អនុវត្តលើជួរឈរលេខទូរស័ព្ទដើម្បីប្រាកដថាវាមានតម្លៃមិនទទេ និងផ្សំច្រើនតែជាលេខ។
អត្ថប្រយោជន៍នៃទិន្នន័យរចនាសម្ព័ន្ធគឺ វាអាចរៀបចំជារបៀបដែលអាចទាក់ទងទៅនឹងទិន្នន័យរចនាសម្ព័ន្ធផ្សេងទៀត។ ប៉ុន្តែដោយសារតែទិន្នន័យត្រូវបានរចនាឡើងឱ្យរៀបចំយ៉ាងជាក់លាក់ ការផ្លាស់ប្តូររចនាសម្ព័ន្ធទាំងមូលអាចចំណាយពេល និងកម្លាំង។ ឧទាហរណ៍ ការបន្ថែមជួរឈរអ៊ីម៉ែលនៅក្នុងសន្លឹកអតិថិជនដែលមិនអាចទទេ វាមានន័យថាអ្នកត្រូវវាយតម្លៃថាតើធ្វើដូចម្តេចដើម្បីបញ្ចូលតម្លៃទាំងនេះទៅលើជួរដែលមានរួចហើយ។
ឧទាហរណ៍ទិន្នន័យរចនាសម្ព័ន្ធ៖ សន្លឹកប៉ារ៉ាហ្វត ឃ្លាំងទិន្នន័យទំនាក់ទំនង លេខទូរស័ព្ទ ស្ថានភាពគណនីធនាគារ
ទិន្នន័យមិនរចនាសម្ព័ន្ធភាគច្រើនមិនអាចចំណាត់ថ្នាក់ទៅជាជួរ ឬជួរឈរបានទេ ហើយមិនមានទ្រង់ទ្រាយ ឬច្បាប់ណាមួយត្រូវធ្វើតាម។ ដោយសារតែទិន្នន័យមិនរចនាសម្ព័ន្ធមានការរឹតត្បិតតិចលើរចនាសម្ព័ន្ធ វាធ្វើឱ្យងាយស្រួលបន្ថែមព័ត៌មានថ្មីជាងទិន្នន័យរចនាសម្ព័ន្ធផ្ទះ។ ប្រសិនបើឧបករណ៍ចាប់សិនស៊ែរប្រមាណបារម៉ែត្រិករៀងរាល់ ២ នាទី បានទទួលការអាប់ដេតដែលអនុញ្ញាតឱ្យវាវាស់ និងកត់ត្រាសីតុណ្ហភាព ពុំចាំបាច់កែប្រែទិន្នន័យដែលមានរួចទេ ប្រសិនបើវាជាទិន្នន័យមិនរចនាសម្ព័ន្ធ។ ទោះជាយ៉ាងណា នេះអាចធ្វើឱ្យការវិភាគ ឬការស្ទង់មតិនៃទិន្នន័យនេះយឺតជាងមុន។ ឧទាហរណ៍ សាកលវិទ្យាធិការម្នាក់ចង់ស្វែងរកសីតុណ្ហភាពមធ្យមនៃខែមុនពីទិន្នន័យឧបករណ៍កញ្ចប់នេះ ហើយរកឃើញថាឧបករណ៍បានកត់ត្រាលេខ "e" នៅក្នុងទិន្នន័យដែលកត់ត្រា ដើម្បីសំគាល់វានៅក្នុងសភាពខូចប៉ុន្តែមិនមែនជាលេខថ្មីទេ គឺមានន័យថាទិន្នន័យមិនពេញលេញ។
ឧទាហរណ៍ទិន្នន័យមិនរចនាសម្ព័ន្ធ៖ ឯកសារអត្ថបទ សារអត្ថបទ ឯកសារវីដេអូ
ទិន្នន័យអមដោយរចនាសម្ព័ន្ធមានលក្ខណៈដែលធ្វើឱ្យវាជាការចម្រុះរវាងទិន្នន័យរចនាសម្ព័ន្ធ និងមិនរចនាសម្ព័ន្ធ។ វាមិនត្រូវតែគោរពតាមទ្រង់ទ្រាយជួរ និងជួរឈរ តែក៏ត្រូវបានរៀបចំដោយរបៀបដែលចាត់ទុកថារចនាសម្ព័ន្ធ ហើយក៏អាចមានទ្រង់ទ្រាយថេរ ឬច្បាប់មួយចំនួនត្រូវតាមដែរ។ រចនាសម្ព័ន្ធនឹងខុសគ្នារវាងប្រភព ដូចជា វាលំដាប់លំដោយបានកំណត់ ឬអ្វីមួយដែលបត់បែនផាសុកភាពដែលអនុញ្ញាតឱ្យបញ្ចូលព័ត៌មានថ្មីបានយ៉ាងងាយស្រួល។ បទទិន្នន័យគឺជាសញ្ញាដែលជួយសម្រេចចិត្តការរៀបចំ និងផ្ទុកទិន្នន័យ ហើយមានឈ្មោះផ្សេងៗគ្នា លោកតាមប្រភេទទិន្នន័យ។ ឧទាហរណ៍ សារអ៊ីមែលមួយធម្មតានឹងមានប្រធានបទ ខ្លឹមសារ និងក្រុមអ្នកទទួល និងអាចរៀបចំតាមនរណាមក ឬពេលវេលាផ្ញើ។
ឧទាហរណ៍ទិន្នន័យអមដោយរចនាសម្ព័ន្ធ៖ HTML, ឯកសារ CSV, JavaScript Object Notation (JSON)
ប្រភពទិន្នន័យគឺជាទីតាំងដើមដែលទិន្នន័យត្រូវបានបង្កើត ឬកន្លែងដែលវា "រស់នៅ" ហើយនឹងខុសគ្នាអាស្រ័យលើវិធី និងពេលវេលាប្រមួលវា។ ទិន្នន័យដែលបង្កើតឡើងដោយអ្នកប្រើគឺហៅថាទិន្នន័យចម្បង ខណៈដែលទិន្នន័យទីពីរមកពីប្រភពដែលបានប្រមូលទិន្នន័យសម្រាប់ការប្រើប្រាស់ទូទៅ។ ឧទាហរណ៍ ក្រុមអ្នកវិទ្យាសាស្រ្តម្នាក់ប្រមូលសង្កេតការណ៍នៅព្រៃឈើផែនដីសព្វថ្ងៃគឺចាត់ទុកថាជាទិន្នន័យចម្បង ហើយប្រសិនបើពួកគេចង់ចែករំលែកវាឲ្យអ្នកវិទ្យាសាស្រ្តផ្សេងវានឹងត្រូវបានចាត់ទុកថាជាទិន្នន័យទីពីរដល់អ្នកដែលប្រើវា។
ឃ្លាំងទិន្នន័យគឺជាប្រភពទូទៅ ដែលផ្អែកលើប្រព័ន្ធគ្រប់គ្រងឃ្លាំងទិន្នន័យសម្រាប់ពាក់ព័ន្ធ និងថែរក្សាទិន្នន័យ ដែលអ្នកប្រើប្រាស់ប្រើពាក្យបញ្ជាដែលហៅថា queries ដើម្បីស្វែងរកទិន្នន័យ។ ឯកសារជាប្រភពទិន្នន័យអាចជាឯកសារប្រភេទសំឡេង រូបភាព និងវីដេអូ ព្រមទាំងសន្លឹកប៉ារ៉ាហ្វតដូចជា Excel។ ប្រភពអ៊ីនធឺណិតគឺជាទីតាំងទូទៅសម្រាប់ផ្តល់ទិន្នន័យ ដែលឃ្លាំងទិន្នន័យ និងឯកសារអាចរកបាននៅទីនេះ។ ការប្រើប្រាស់ Application Programming Interfaces ដែលហៅថា APIs អនុញ្ញាតឱ្យអ្នកកម្មវិធីបង្កើតវិធីក្នុងចែករំលែកទិន្នន័យជាមួយអ្នកប្រើក្រៅតាមអ៊ីនធឺណិត ខណៈពេលដែលដំណើរការជម្រះគេហទំព័រលុយទិន្នន័យពីទំព័របណ្តាញ។ មេរៀនក្នុងផ្នែក Working with Data ផ្ដោតលើរបៀបប្រើប្រាស់ប្រភពទិន្នន័យផ្សេងៗគ្នា។
ក្នុងមេរៀននេះ យើងបានរៀនដូចខាងក្រោម៖
- តើទិន្នន័យជាអ្វី
- របៀបពិពណ៌នាទិន្នន័យ
- របៀបចំណាត់ថ្នាក់ទិន្នន័យ និងចំណាត់ថ្នាក់ទិន្នន័យ
- ទីកន្លែងដែលអាចរកបានទិន្នន័យ
Kaggle គឺជាប្រភពល្អឥតខ្ចោះនៃលំដាប់ទិន្នន័យបើកចំហ។ ប្រើប្រាស់ ឧបករណ៍ស្វែងរកលំដាប់ទិន្នន័យ ដើម្បីស្វែងរកលំដាប់ទិន្នន័យដែលគួរស្អាត និងចំណាត់ថ្នាក់ 3-5 លំដាប់ទិន្នន័យដោយគោលការណ៍ដូចតទៅ៖
- តើទិន្នន័យមានលក្ខណៈកំណិតឬគុណលក្ខណៈ?
- តើទិន្នន័យរចនាសម្ព័ន្ធ មិនរចនាសម្ព័ន្ធ ឬអមដោយរចនាសម្ព័ន្ធ?
- ឯកតា Microsoft Learn នេះ ដែលមានចំណងជើងថា ចំណាត់ថ្នាក់ទិន្នន័យរបស់អ្នក មានការបំបែកលំអិតអំពីទិន្នន័យរចនាសម្ព័ន្ធ អមដោយរចនាសម្ព័ន្ធ និងមិនរចនាសម្ព័ន្ធ។
ការបដិសេធ៖
ឯកសារនេះត្រូវបានបកប្រែដោយប្រើសេវាកម្មបកប្រែ AI Co-op Translator។ ក្នុងពេលដែលយើងព្យាយាមធ្វើឱ្យបានប្រក្រតី សូមកុំភ្លេចថាការបកប្រែអូតូម៉ាទិកអាចមានខុសភាព ឬមិនត្រឹមត្រូវ។ ឯកសារដើមនៅក្នុងភាសាដើមគឺគួរឱ្យភ្ជាប់ជាប្រភពផ្លូវការ។ សម្រាប់ព័ត៌មានសំខាន់ៗ ការបកប្រែដោយមនុស្សជំនាញជាអាទិភាព។ យើងមិនមានភារកិច្ចទទួលខុសត្រូវចំពោះការយល់ខុស ឬការបញ្ជ្រាស់ន័យដែលកើតមានពីការប្រើប្រាស់ការបកប្រែនេះទេ។
