Skip to content

Latest commit

 

History

History
169 lines (124 loc) · 36.4 KB

File metadata and controls

169 lines (124 loc) · 36.4 KB

డేటా సైన్స్ నిర్వచనం

 Sketchnote by (@sketchthedocs)
డేటా సైన్స్ నిర్వచనం - స్కెచ్ నోట్ @nitya ద్వారా

డేటా సైన్స్ నిర్వచనం వీడియో

డేటా అంటే ఏమిటి?

మన రోజువారీ జీవితంలో, మనం ఎప్పుడూ డేటాతో చుట్టబడి ఉంటాము. మీరు ఇప్పుడు చదువుతున్న వచనం డేటానే. మీ స్మార్ట్‌ఫోన్‌లో మీ స్నేహితుల ఫోన్ నంబర్ల జాబితా డేటా, అలాగే మీ గడియారంలో ప్రదర్శించబడుతున్న ప్రస్తుత సమయం కూడా డేటానే. మనుషులుగా, మనం సహజంగానే డేటాతో పనిచేస్తాము, మన దగ్గర ఉన్న డబ్బును లెక్కించడం లేదా స్నేహితులకు లేఖలు రాయడం ద్వారా.

కానీ, కంప్యూటర్లు సృష్టించబడిన తర్వాత డేటా చాలా ముఖ్యమైంది అయింది. కంప్యూటర్ల ప్రాథమిక పాత్ర గణనలను నిర్వహించడం, కానీ అవి ఆపరేట్ చేయడానికి డేటా అవసరం. కాబట్టి, మనం కంప్యూటర్లు డేటాను ఎలా నిల్వ చేస్తాయో, ప్రాసెస్ చేస్తాయో అర్థం చేసుకోవాలి.

ఇంటర్నెట్ ఉద్భవంతో, కంప్యూటర్ల పాత్ర డేటా నిర్వహణ పరికరాలుగా పెరిగింది. మీరు ఆలోచిస్తే, ఇప్పుడు మనం కంప్యూటర్లను గణనలకు కాకుండా డేటా ప్రాసెసింగ్ మరియు కమ్యూనికేషన్ కోసం ఎక్కువగా ఉపయోగిస్తున్నాము. మనం స్నేహితునికి ఇమెయిల్ రాస్తున్నప్పుడు లేదా ఇంటర్నెట్‌లో సమాచారాన్ని శోధిస్తున్నప్పుడు - మనం అసలు డేటాను సృష్టించడం, నిల్వ చేయడం, ప్రసారం చేయడం మరియు మార్చడం చేస్తున్నాము.

మీరు చివరిసారిగా కంప్యూటర్లను వాస్తవంగా ఏదైనా గణన చేయడానికి ఉపయోగించినప్పుడు గుర్తు చేసుకోగలరా?

డేటా సైన్స్ అంటే ఏమిటి?

వికీపీడియా ప్రకారం, డేటా సైన్స్ అనేది సంఘటిత మరియు అసంఘటిత డేటా నుండి జ్ఞానం మరియు అవగాహనలను పొందడానికి శాస్త్రీయ పద్ధతులను ఉపయోగించే శాస్త్రీయ రంగం, మరియు విస్తృత అనువర్తన రంగాలలో డేటా నుండి జ్ఞానం మరియు అమలు చేయదగిన అవగాహనలను వర్తింపజేసే రంగంగా నిర్వచించబడింది.

ఈ నిర్వచనం డేటా సైన్స్ యొక్క క్రింది ముఖ్యాంశాలను హైలైట్ చేస్తుంది:

  • డేటా సైన్స్ యొక్క ప్రధాన లక్ష్యం డేటా నుండి జ్ఞానం పొందడం, అంటే - డేటాను అర్థం చేసుకోవడం, కొన్ని దాగి ఉన్న సంబంధాలను కనుగొనడం మరియు ఒక మోడల్ నిర్మించడం.
  • డేటా సైన్స్ శాస్త్రీయ పద్ధతులను ఉపయోగిస్తుంది, ఉదాహరణకు సంభావ్యత మరియు గణాంకాలు. వాస్తవానికి, డేటా సైన్స్ అనే పదం మొదట ప్రవేశపెట్టినప్పుడు, కొంతమంది డేటా సైన్స్ గణాంకాలకి కొత్త ఫ్యాన్సీ పేరు మాత్రమే అని వాదించారు. ఇప్పుడు ఈ రంగం చాలా విస్తృతమైందని స్పష్టమైంది.
  • పొందిన జ్ఞానం కొన్ని అమలు చేయదగిన అవగాహనలను ఉత్పత్తి చేయడానికి ఉపయోగించాలి, అంటే మీరు వాస్తవ వ్యాపార పరిస్థితులకు వర్తింపజేయగల ప్రాక్టికల్ అవగాహన.
  • మనం సంఘటిత మరియు అసంఘటిత డేటా రెండింటిపై కూడా ఆపరేట్ చేయగలగాలి. కోర్సులో తరువాత డేటా రకాల గురించి మళ్ళీ చర్చిస్తాము.
  • అనువర్తన రంగం ఒక ముఖ్యమైన భావన, మరియు డేటా శాస్త్రవేత్తలు తరచుగా సమస్య రంగంలో కనీసం కొంత నైపుణ్యం కలిగి ఉండాలి, ఉదాహరణకు: ఫైనాన్స్, వైద్యం, మార్కెటింగ్ మొదలైనవి.

డేటా సైన్స్ యొక్క మరో ముఖ్యాంశం ఏమిటంటే, ఇది డేటాను కంప్యూటర్ల ద్వారా ఎలా సేకరించవచ్చో, నిల్వ చేయవచ్చో, ఆపరేట్ చేయవచ్చో అధ్యయనం చేస్తుంది. గణాంకాలు మనకు గణిత శాస్త్రపు ఆధారాలను ఇస్తే, డేటా సైన్స్ గణిత సూత్రాలను వాస్తవంగా డేటా నుండి అవగాహనలను పొందడానికి వర్తింపజేస్తుంది.

డేటా సైన్స్‌ను చూడటానికి ఒక మార్గం (జిమ్ గ్రేకి అప్పగించబడింది) ఇది శాస్త్రం యొక్క వేరే ఒక పారడైమ్‌గా పరిగణించవచ్చు:

  • ప్రయోగాత్మక (Empirical), ఇందులో మనం ఎక్కువగా పరిశీలనలు మరియు ప్రయోగాల ఫలితాలపై ఆధారపడతాము
  • సిద్ధాంతాత్మక (Theoretical), ఇక్కడ కొత్త భావనలు ఉన్న శాస్త్రీయ జ్ఞానంలో నుండి ఉద్భవిస్తాయి
  • గణనాత్మక (Computational), ఇక్కడ మనం కొన్ని గణనాత్మక ప్రయోగాల ఆధారంగా కొత్త సూత్రాలను కనుగొంటాము
  • డేటా-ఆధారిత (Data-Driven), డేటాలో సంబంధాలు మరియు నమూనాలను కనుగొనడంపై ఆధారపడి ఉంటుంది

ఇతర సంబంధిత రంగాలు

డేటా విస్తృతంగా ఉండటంతో, డేటా సైన్స్ కూడా విస్తృత రంగం, అనేక ఇతర శాస్త్రాలను స్పర్శిస్తుంది.

డేటాబేసులు
ముఖ్యమైన పరిగణన ఏమిటంటే డేటాను ఎలా నిల్వ చేయాలి, అంటే వేగంగా ప్రాసెస్ చేయడానికి ఎలా నిర్మించాలి. వివిధ రకాల డేటాబేసులు ఉన్నాయి, అవి సంఘటిత మరియు అసంఘటిత డేటాను నిల్వ చేస్తాయి, వాటిని మన కోర్సులో పరిశీలిస్తాము.
బిగ్ డేటా
చాలా పెద్ద పరిమాణంలో సాదారణ నిర్మాణంతో ఉన్న డేటాను నిల్వ చేసి ప్రాసెస్ చేయాల్సి వస్తుంది. కంప్యూటర్ క్లస్టర్‌లో పంపిణీ చేయబడిన విధంగా ఆ డేటాను నిల్వ చేయడానికి మరియు సమర్థవంతంగా ప్రాసెస్ చేయడానికి ప్రత్యేక పద్ధతులు మరియు సాధనాలు ఉన్నాయి.
మిషన్ లెర్నింగ్
డేటాను అర్థం చేసుకోవడానికి ఒక మార్గం అనేది కావలసిన ఫలితాన్ని అంచనా వేయగలిగే మోడల్ నిర్మించడం. డేటా నుండి మోడల్స్ అభివృద్ధి చేయడం మిషన్ లెర్నింగ్ అని పిలవబడుతుంది. దీని గురించి మరింత తెలుసుకోవడానికి మన Machine Learning for Beginners పాఠ్యాంశాన్ని చూడవచ్చు.
కృత్రిమ మేధస్సు
మిషన్ లెర్నింగ్ యొక్క ఒక విభాగం అయిన కృత్రిమ మేధస్సు (AI) కూడా డేటాపై ఆధారపడి ఉంటుంది, మరియు ఇది మానవ ఆలోచనా ప్రక్రియలను అనుకరించే అధిక సంక్లిష్టత మోడల్స్ నిర్మించడంలో నిమగ్నమవుతుంది. AI పద్ధతులు తరచుగా అసంఘటిత డేటాను (ఉదా: సహజ భాష) సంఘటిత అవగాహనలుగా మార్చడానికి సహాయపడతాయి.
విజువలైజేషన్
చాలా పెద్ద పరిమాణంలో ఉన్న డేటా మనుషులకు అర్థం కాకపోవచ్చు, కానీ ఆ డేటాను ఉపయోగించి ఉపయోగకరమైన విజువలైజేషన్లు సృష్టించినప్పుడు, మనం డేటాను బాగా అర్థం చేసుకుని కొన్ని తర్కాలను తీసుకోవచ్చు. కాబట్టి, సమాచారాన్ని విజువలైజ్ చేయడానికి అనేక మార్గాలను తెలుసుకోవడం ముఖ్యం - ఇది మన కోర్సు మూడు సెక్షన్లో కవర్ చేస్తాము. సంబంధిత రంగాలు ఇన్ఫోగ్రాఫిక్స్ మరియు సాధారణంగా హ్యూమన్-కంప్యూటర్ ఇంటరాక్షన్ కూడా ఉన్నాయి.

డేటా రకాలు

మనం ఇప్పటికే చెప్పినట్లుగా, డేటా ఎక్కడా ఉంటుంది. మనం దాన్ని సరైన విధంగా సేకరించాలి! సంఘటిత మరియు అసంఘటిత డేటాను వేరుచేయడం ఉపయోగకరం. మొదటిది సాధారణంగా బాగా నిర్మించబడిన రూపంలో ఉంటుంది, తరచుగా ఒక పట్టిక లేదా పలు పట్టికల రూపంలో, మరొకటి కేవలం ఫైళ్ల సేకరణ మాత్రమే. కొన్నిసార్లు మనం అర్ధ-సంఘటిత డేటా గురించి కూడా మాట్లాడవచ్చు, దీనికి కొంత నిర్మాణం ఉంటుంది కానీ అది చాలా మారవచ్చు.

సంఘటిత అర్ధ-సంఘటిత అసంఘటిత
వ్యక్తుల ఫోన్ నంబర్ల జాబితా లింకులతో ఉన్న వికీపీడియా పేజీలు ఎన్సైక్లోపిడియా బ్రిటానికా వచనం
గత 20 సంవత్సరాల పాటు ప్రతి నిమిషం భవనం లోని అన్ని గదుల ఉష్ణోగ్రత రచయితలు, ప్రచురణ తేదీ, సారాంశంతో JSON ఫార్మాట్‌లో శాస్త్రీయ పత్రాల సేకరణ కార్పొరేట్ డాక్యుమెంట్లతో ఫైల్ షేర్
భవనంలో ప్రవేశించే అన్ని వ్యక్తుల వయస్సు మరియు లింగం డేటా ఇంటర్నెట్ పేజీలు పర్యవేక్షణ కెమెరా నుండి రా వీడియో ఫీడ్

డేటా ఎక్కడ నుండి పొందాలి

డేటా పొందడానికి అనేక సాధ్యమైన మూలాలు ఉన్నాయి, వాటన్నింటినీ జాబితా చేయడం అసాధ్యం! అయినప్పటికీ, మీరు డేటా పొందగల సాధారణ ప్రదేశాలను కొన్ని చెప్పుకుందాం:

  • సంఘటిత
    • ఇంటర్నెట్ ఆఫ్ థింగ్స్ (IoT), ఉష్ణోగ్రత లేదా ఒత్తిడి సెన్సార్ల వంటి వివిధ సెన్సార్ల నుండి డేటా సహా, చాలా ఉపయోగకరమైన డేటాను అందిస్తుంది. ఉదాహరణకు, ఒక కార్యాలయ భవనం IoT సెన్సార్లతో సజ్జమైతే, మనం ఆటోమేటిక్‌గా వేడి మరియు లైటింగ్‌ను నియంత్రించి ఖర్చులను తగ్గించవచ్చు.
    • సర్వేలు వినియోగదారులు కొనుగోలు తర్వాత లేదా వెబ్ సైట్ సందర్శించిన తర్వాత పూర్తి చేయమని అడిగే ప్రశ్నావళి.
    • ప్రవర్తన విశ్లేషణ ఉదాహరణకు, వినియోగదారు ఒక సైట్ లో ఎంత లోతుగా వెళ్తున్నాడో, మరియు సైట్ నుండి బయటకు వెళ్లడానికి సాధారణ కారణం ఏమిటో అర్థం చేసుకోవడంలో సహాయపడుతుంది.
  • అసంఘటిత
    • వచనాలు ఒక సంపూర్ణ భావోద్వేగ స్కోరు లేదా కీలకపదాలు మరియు సారాంశాన్ని తీసివేయడం వంటి అవగాహనల సమృద్ధి మూలం కావచ్చు.
    • చిత్రాలు లేదా వీడియో. పర్యవేక్షణ కెమెరా నుండి వీడియో రోడ్డుపై ట్రాఫిక్ అంచనా వేయడానికి మరియు ట్రాఫిక్ జామ్‌ల గురించి ప్రజలకు సమాచారం ఇవ్వడానికి ఉపయోగించవచ్చు.
    • వెబ్ సర్వర్ లాగ్స్ మన సైట్ లో ఏ పేజీలు ఎక్కువగా సందర్శించబడుతున్నాయో, మరియు ఎంతసేపు ఉంటున్నారో అర్థం చేసుకోవడానికి ఉపయోగించవచ్చు.
  • అర్ధ-సంఘటిత
    • సోషల్ నెట్‌వర్క్ గ్రాఫ్లు వినియోగదారుల వ్యక్తిత్వాలు మరియు సమాచారాన్ని వ్యాప్తి చేయడంలో సామర్థ్యం గురించి మంచి డేటా మూలాలు కావచ్చు.
    • పార్టీ నుండి ఫోటోలు ఉన్నప్పుడు, మనం ఒకరితో ఒకరు ఫోటోలు తీసుకునే వ్యక్తుల గ్రాఫ్ నిర్మించి గ్రూప్ డైనమిక్స్ డేటాను తీసివేయవచ్చు.

వివిధ డేటా మూలాలను తెలుసుకోవడం ద్వారా, మీరు వివిధ పరిస్థితుల గురించి ఆలోచించి, డేటా సైన్స్ సాంకేతికతలను వర్తింపజేసి పరిస్థితిని మెరుగుపరచడానికి ప్రయత్నించవచ్చు.

డేటాతో మీరు ఏమి చేయగలరు

డేటా సైన్స్‌లో, మనం డేటా ప్రయాణం క్రింది దశలపై దృష్టి పెడతాము:

1) డేటా సేకరణ
మొదటి దశ డేటాను సేకరించడం. చాలా సందర్భాల్లో ఇది సులభమైన ప్రక్రియ కావచ్చు, ఉదాహరణకు వెబ్ అప్లికేషన్ నుండి డేటా డేటాబేస్‌కు వస్తుంది, కానీ కొన్నిసార్లు ప్రత్యేక సాంకేతికతలు ఉపయోగించాల్సి ఉంటుంది. ఉదాహరణకు, IoT సెన్సార్ల నుండి డేటా అధికంగా ఉండవచ్చు, అందువల్ల IoT హబ్ వంటి బఫరింగ్ ఎండ్పాయింట్లను ఉపయోగించి అన్ని డేటాను సేకరించి తర్వాత ప్రాసెస్ చేయడం మంచి పద్ధతి.
2) డేటా నిల్వ
డేటాను నిల్వ చేయడం సవాలు కావచ్చు, ముఖ్యంగా బిగ్ డేటా గురించి మాట్లాడుతున్నప్పుడు. డేటాను ఎలా నిల్వ చేయాలో నిర్ణయించేటప్పుడు, భవిష్యత్తులో మీరు డేటాను ఎలా క్వెరీ చేయాలనుకుంటున్నారో ముందుగా ఊహించడం మంచిది. డేటాను నిల్వ చేసే కొన్ని మార్గాలు ఉన్నాయి:
  • ఒక రిలేషనల్ డేటాబేస్ పట్టికల సేకరణను నిల్వ చేస్తుంది, మరియు వాటిని క్వెరీ చేయడానికి SQL అనే ప్రత్యేక భాషను ఉపయోగిస్తుంది. సాధారణంగా, పట్టికలు వివిధ గ్రూపులుగా, స్కీమాలుగా పిలవబడతాయి. చాలా సందర్భాల్లో డేటాను అసలు రూపం నుండి స్కీమాకు సరిపడేలా మార్చాల్సి ఉంటుంది.
  • NoSQL డేటాబేస్, ఉదాహరణకు CosmosDB, డేటాపై స్కీమాలను అమలు చేయదు, మరియు మరింత సంక్లిష్టమైన డేటాను నిల్వ చేయడానికి అనుమతిస్తుంది, ఉదాహరణకు, హైరార్కికల్ JSON డాక్యుమెంట్లు లేదా గ్రాఫ్లు. అయితే, NoSQL డేటాబేసులకు SQL లాంటి సమృద్ధి క్వెరీ సామర్థ్యాలు లేవు, మరియు రిఫరెన్షియల్ ఇంటిగ్రిటీని అమలు చేయలేవు, అంటే పట్టికల నిర్మాణం మరియు పట్టికల మధ్య సంబంధాలను నియంత్రించే నియమాలు.
  • డేటా లేక్ నిల్వ అనేది పెద్ద పరిమాణంలో ఉన్న రా, అసంఘటిత డేటా సేకరణ కోసం ఉపయోగిస్తారు. డేటా లేక్స్ తరచుగా బిగ్ డేటాతో ఉపయోగిస్తారు, అందులో అన్ని డేటా ఒకే యంత్రంలో సరిపోదు, కాబట్టి క్లస్టర్ సర్వర్ల ద్వారా నిల్వ చేసి ప్రాసెస్ చేయాలి. పార్కెట్ అనేది బిగ్ డేటాతో తరచుగా ఉపయోగించే డేటా ఫార్మాట్.
3) డేటా ప్రాసెసింగ్
ఇది డేటా ప్రయాణంలో అత్యంత ఆసక్తికరమైన భాగం, ఇది డేటాను అసలు రూపం నుండి విజువలైజేషన్/మోడల్ శిక్షణకు ఉపయోగించే రూపంలోకి మార్చడం. వచనం లేదా చిత్రాల వంటి అసంఘటిత డేటాతో వ్యవహరించేటప్పుడు, మనం కొంత AI సాంకేతికతలను ఉపయోగించి డేటా నుండి ఫీచర్లు తీసివేయవచ్చు, తద్వారా దాన్ని సంఘటిత రూపంలోకి మార్చవచ్చు.
4) విజువలైజేషన్ / మానవ అవగాహన
చాలాసార్లు, డేటాను అర్థం చేసుకోవడానికి, మనం దాన్ని విజువలైజ్ చేయాలి. మన టూల్‌బాక్స్‌లో అనేక విజువలైజేషన్ పద్ధతులు ఉండటం వల్ల, సరైన దృశ్యాన్ని కనుగొని అవగాహన పొందవచ్చు. తరచుగా, డేటా శాస్త్రవేత్త డేటాతో "ఆడుకుంటూ", దాన్ని ఎన్నో సార్లు విజువలైజ్ చేసి సంబంధాలను వెతుకుతాడు. అలాగే, మనం గణాంక పద్ధతులను ఉపయోగించి ఒక హైపోథసిస్‌ను పరీక్షించవచ్చు లేదా డేటా భాగాల మధ్య సంబంధాన్ని నిరూపించవచ్చు.
5) అంచనా మోడల్ శిక్షణ
డేటా సైన్స్ యొక్క తుది లక్ష్యం డేటా ఆధారంగా నిర్ణయాలు తీసుకోవడం కావడంతో, మనం మిషన్ లెర్నింగ్ సాంకేతికతలను ఉపయోగించి అంచనా మోడల్ నిర్మించవచ్చు. తరువాత, ఈ మోడల్‌ను ఉపయోగించి సమాన నిర్మాణాలున్న కొత్త డేటా సెట్‌లపై అంచనాలు చేయవచ్చు.

తప్పకుండా, వాస్తవ డేటాపై ఆధారపడి, కొన్ని దశలు లేకపోవచ్చు (ఉదా: మనకు ఇప్పటికే డేటా డేటాబేస్‌లో ఉన్నప్పుడు, లేదా మోడల్ శిక్షణ అవసరం లేకపోతే), లేదా కొన్ని దశలు పలు సార్లు పునరావృతమవ్వచ్చు (ఉదా: డేటా ప్రాసెసింగ్).

డిజిటలైజేషన్ మరియు డిజిటల్ ట్రాన్స్‌ఫర్మేషన్

గత దశాబ్దంలో, అనేక వ్యాపారాలు వ్యాపార నిర్ణయాలు తీసుకునేటప్పుడు డేటా ప్రాముఖ్యతను అర్థం చేసుకున్నాయి. వ్యాపారాన్ని నడిపించడానికి డేటా సైన్స్ సూత్రాలను వర్తింపజేయడానికి, మొదట కొంత డేటాను సేకరించాలి, అంటే వ్యాపార ప్రక్రియలను డిజిటల్ రూపంలోకి మార్చాలి. దీనిని డిజిటలైజేషన్ అంటారు. ఈ డేటాపై డేటా సైన్స్ సాంకేతికతలను వర్తింపజేసి నిర్ణయాలను మార్గనిర్దేశం చేయడం ద్వారా ఉత్పాదకతలో గణనీయమైన పెరుగుదల (లేదా వ్యాపార మార్పు) సాధించవచ్చు, దీనిని డిజిటల్ ట్రాన్స్‌ఫర్మేషన్ అంటారు.

ఒక ఉదాహరణను పరిశీలిద్దాం. మనకు ఒక డేటా సైన్స్ కోర్సు (ఇలాంటి ఒకటి) ఉంది, దీన్ని మనం ఆన్‌లైన్‌లో విద్యార్థులకు అందిస్తున్నాము, మరియు దీన్ని మెరుగుపరచడానికి డేటా సైన్స్ ఉపయోగించాలనుకుంటున్నాము. మనం ఎలా చేయగలం?

మనం మొదట అడగవచ్చు "ఏం డిజిటలైజ్ చేయవచ్చు?" సులభమైన మార్గం ప్రతి విద్యార్థి ప్రతి మాడ్యూల్ పూర్తి చేయడానికి తీసుకునే సమయాన్ని కొలవడం, మరియు ప్రతి మాడ్యూల్ చివరలో బహుళ ఎంపిక పరీక్ష ద్వారా పొందిన జ్ఞానాన్ని కొలవడం. అన్ని విద్యార్థుల సమయాన్ని సగటు తీసుకుంటే, ఏ మాడ్యూల్స్ విద్యార్థులకు ఎక్కువ కష్టాలు కలిగిస్తున్నాయో తెలుసుకుని వాటిని సులభతరం చేయడానికి పని చేయవచ్చు.

మీరు ఈ విధానం సరైనది కాదని వాదించవచ్చు, ఎందుకంటే మాడ్యూల్స్ వివిధ పొడవులలో ఉండవచ్చు. మాడ్యూల్ పొడవు (అక్షరాల సంఖ్యలో) ద్వారా సమయాన్ని భాగించటం మరింత న్యాయమైనది, మరియు ఆ విలువలను పోల్చటం మంచిది.

మేము బహుళ-ఎంపిక పరీక్షల ఫలితాలను విశ్లేషించడం ప్రారంభించినప్పుడు, విద్యార్థులు అర్థం చేసుకోవడంలో కష్టపడుతున్న భావనలను గుర్తించడానికి ప్రయత్నించవచ్చు, మరియు ఆ సమాచారాన్ని ఉపయోగించి కంటెంట్‌ను మెరుగుపరచవచ్చు. దానికి, ప్రతి ప్రశ్న ఒక నిర్దిష్ట భావన లేదా జ్ఞాన భాగానికి మ్యాప్ అయ్యే విధంగా పరీక్షలను రూపకల్పన చేయాలి.

మరింత క్లిష్టంగా చేయాలనుకుంటే, మేము ప్రతి మాడ్యూల్ కోసం తీసుకున్న సమయాన్ని విద్యార్థుల వయస్సు వర్గంతో పోల్చి గ్రాఫ్ చేయవచ్చు. కొన్ని వయస్సు వర్గాల కోసం మాడ్యూల్ పూర్తి చేయడానికి అనవసరంగా ఎక్కువ సమయం పడుతుందని లేదా విద్యార్థులు పూర్తి చేయకముందే వదిలివేస్తారని కనుగొనవచ్చు. ఇది మాడ్యూల్ కోసం వయస్సు సిఫార్సులను అందించడంలో సహాయపడుతుంది, మరియు తప్పు అంచనాల వల్ల ప్రజల అసంతృప్తిని తగ్గిస్తుంది.

🚀 సవాలు

ఈ సవాలలో, మేము డేటా సైన్స్ రంగానికి సంబంధించిన భావనలను పాఠ్యాలను పరిశీలించడం ద్వారా కనుగొనడానికి ప్రయత్నిస్తాము. మేము డేటా సైన్స్ పై వికీపీడియా వ్యాసాన్ని తీసుకుని, టెక్స్ట్‌ను డౌన్లోడ్ చేసి ప్రాసెస్ చేసి, ఈ విధమైన పద మేఘాన్ని నిర్మిస్తాము:

Word Cloud for Data Science

కోడ్‌ను చదవడానికి notebook.ipynb ను సందర్శించండి. మీరు కోడ్‌ను కూడా నడిపించి, అన్ని డేటా మార్పిడి ప్రక్రియలను ప్రత్యక్షంగా చూడవచ్చు.

మీరు జూపిటర్ నోట్‌బుక్‌లో కోడ్ ఎలా నడిపించాలో తెలియకపోతే, ఈ వ్యాసం చూడండి.

అసైన్‌మెంట్లు

క్రెడిట్స్

ఈ పాఠం ♥️ తో Dmitry Soshnikov రచించారు


అస్పష్టత:
ఈ పత్రాన్ని AI అనువాద సేవ Co-op Translator ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. అసలు పత్రం దాని స్వదేశీ భాషలోనే అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారుల కోసం మేము బాధ్యత వహించము.