Skip to content

Latest commit

 

History

History
195 lines (133 loc) · 22.7 KB

File metadata and controls

195 lines (133 loc) · 22.7 KB

விகிதங்களை காட்சிப்படுத்துதல்

 Sketchnote by (@sketchthedocs)
விகிதங்களை காட்சிப்படுத்துதல் - Sketchnote by @nitya

இந்த பாடத்தில், நீங்கள் இயற்கை சார்ந்த வேறு தரவுத்தொகுப்பைப் பயன்படுத்தி விகிதங்களை காட்சிப்படுத்தப் போகிறீர்கள், உதாரணமாக, காளான் பற்றிய தரவுத்தொகுப்பில் எத்தனை வகையான பூஞ்சைகள் உள்ளன என்பதைப் பார்க்கலாம். Audubon-இன் தரவுத்தொகுப்பிலிருந்து பெறப்பட்ட Agaricus மற்றும் Lepiota குடும்பங்களில் உள்ள 23 வகையான காளான்களின் விவரங்களைப் பயன்படுத்தி இந்த அற்புதமான பூஞ்சைகளை ஆராய்வோம். நீங்கள் பின்வரும் சுவையான காட்சிகளை முயற்சிக்கலாம்:

  • பை வரைபடங்கள் 🥧
  • டோனட் வரைபடங்கள் 🍩
  • வாஃபிள் வரைபடங்கள் 🧇

💡 Microsoft Research-இன் Charticulator எனும் ஒரு மிகவும் 흥미로운 திட்டம் தரவுக் காட்சிப்படுத்தலுக்கான இலவச டிராக் அண்ட் டிராப் இடைமுகத்தை வழங்குகிறது. அவர்களின் ஒரு டுடோரியலில் கூட இந்த காளான் தரவுத்தொகுப்பைப் பயன்படுத்துகிறார்கள்! எனவே, நீங்கள் தரவுகளை ஆராய்ந்து, அதே நேரத்தில் நூலகத்தைப் பற்றியும் கற்றுக்கொள்ளலாம்: Charticulator tutorial.

உங்கள் காளான்களைப் பற்றி அறிந்து கொள்ளுங்கள் 🍄

காளான்கள் மிகவும் 흥미மானவை. அவற்றைப் படிக்க ஒரு தரவுத்தொகுப்பை இறக்குமதி செய்வோம்:

import pandas as pd
import matplotlib.pyplot as plt
mushrooms = pd.read_csv('../../data/mushrooms.csv')
mushrooms.head()

ஒரு அட்டவணை அச்சிடப்பட்டு, பகுப்பாய்வுக்கான சிறந்த தரவுகளை வழங்குகிறது:

வகுப்பு தொப்பி வடிவம் தொப்பி மேற்பரப்பு தொப்பி நிறம் காயம் மணம் கில்கள் இணைப்பு கில்கள் இடைவெளி கில்கள் அளவு கில்கள் நிறம் கம்பம் வடிவம் கம்பம் வேர்கள் கம்பம் மேற்பரப்பு-கோடு மேல் கம்பம் மேற்பரப்பு-கோடு கீழ் கம்பம் நிறம்-கோடு மேல் கம்பம் நிறம்-கோடு கீழ் மடல் வகை மடல் நிறம் வளைய எண் வளைய வகை மஞ்சள்-அச்சு-நிறம் மக்கள் தொகை வாழிடம்
விஷம் வளைந்தது மிருதுவானது பழுப்பு காயம் துர்நாற்றம் சுதந்திரம் நெருக்கமானது குறுகியது கருப்பு பெரிதாக்குதல் சமமானது மிருதுவானது மிருதுவானது வெள்ளை வெள்ளை பகுதி வெள்ளை ஒன்று தொங்கும் கருப்பு சிதறியவை நகரம்
சாப்பிடக்கூடியது வளைந்தது மிருதுவானது மஞ்சள் காயம் பாதாம் சுதந்திரம் நெருக்கமானது அகலமானது கருப்பு பெரிதாக்குதல் கிளப் மிருதுவானது மிருதுவானது வெள்ளை வெள்ளை பகுதி வெள்ளை ஒன்று தொங்கும் பழுப்பு ஏராளமானவை புல்வெளிகள்
சாப்பிடக்கூடியது மணி மிருதுவானது வெள்ளை காயம் சோம்பல் சுதந்திரம் நெருக்கமானது அகலமானது பழுப்பு பெரிதாக்குதல் கிளப் மிருதுவானது மிருதுவானது வெள்ளை வெள்ளை பகுதி வெள்ளை ஒன்று தொங்கும் பழுப்பு ஏராளமானவை புலங்கள்
விஷம் வளைந்தது பரப்பானது வெள்ளை காயம் துர்நாற்றம் சுதந்திரம் நெருக்கமானது குறுகியது பழுப்பு பெரிதாக்குதல் சமமானது மிருதுவானது மிருதுவானது வெள்ளை வெள்ளை பகுதி வெள்ளை ஒன்று தொங்கும் கருப்பு சிதறியவை நகரம்

உடனடியாக, அனைத்து தரவுகளும் உரை வடிவத்தில் இருப்பதை நீங்கள் கவனிக்கிறீர்கள். இந்த தரவுகளை ஒரு வரைபடத்தில் பயன்படுத்த, நீங்கள் மாற்ற வேண்டும். உண்மையில், பெரும்பாலான தரவுகள் ஒரு பொருளாக பிரதிநிதித்துவம் செய்கின்றன:

print(mushrooms.select_dtypes(["object"]).columns)

வெளியீடு:

Index(['class', 'cap-shape', 'cap-surface', 'cap-color', 'bruises', 'odor',
       'gill-attachment', 'gill-spacing', 'gill-size', 'gill-color',
       'stalk-shape', 'stalk-root', 'stalk-surface-above-ring',
       'stalk-surface-below-ring', 'stalk-color-above-ring',
       'stalk-color-below-ring', 'veil-type', 'veil-color', 'ring-number',
       'ring-type', 'spore-print-color', 'population', 'habitat'],
      dtype='object')

இந்த தரவுகளை எடுத்து 'வகுப்பு' நெடுவரிசையை ஒரு வகையாக மாற்றுங்கள்:

cols = mushrooms.select_dtypes(["object"]).columns
mushrooms[cols] = mushrooms[cols].astype('category')
edibleclass=mushrooms.groupby(['class']).count()
edibleclass

இப்போது, நீங்கள் காளான் தரவுகளை அச்சிடினால், அது விஷம்/சாப்பிடக்கூடிய வகுப்புகளின் படி பிரிக்கப்பட்டு வகைகளாகக் குழுவாக்கப்பட்டிருப்பதை நீங்கள் காணலாம்:

தொப்பி வடிவம் தொப்பி மேற்பரப்பு தொப்பி நிறம் காயம் மணம் கில்கள் இணைப்பு கில்கள் இடைவெளி கில்கள் அளவு கில்கள் நிறம் கம்பம் வடிவம் ... கம்பம் மேற்பரப்பு-கோடு கீழ் கம்பம் நிறம்-கோடு மேல் கம்பம் நிறம்-கோடு கீழ் மடல் வகை மடல் நிறம் வளைய எண் வளைய வகை மஞ்சள்-அச்சு-நிறம் மக்கள் தொகை வாழிடம்
வகுப்பு
சாப்பிடக்கூடியது 4208 4208 4208 4208 4208 4208 4208 4208 4208 4208 ... 4208 4208 4208 4208 4208 4208 4208 4208 4208 4208
விஷம் 3916 3916 3916 3916 3916 3916 3916 3916 3916 3916 ... 3916 3916 3916 3916 3916 3916 3916 3916 3916 3916

இந்த அட்டவணையில் வழங்கப்பட்ட வரிசையைப் பின்பற்றி உங்கள் வகுப்பு வகை லேபிள்களை உருவாக்கினால், நீங்கள் ஒரு பை வரைபடத்தை உருவாக்கலாம்:

பை!

labels=['Edible','Poisonous']
plt.pie(edibleclass['population'],labels=labels,autopct='%.1f %%')
plt.title('Edible?')
plt.show()

வோலா, இந்த இரண்டு வகுப்புகளின் படி தரவின் விகிதங்களை காட்டும் ஒரு பை வரைபடம். குறிப்பாக இங்கு லேபிள் வரிசையின் சரியான ஒழுங்கை பெறுவது மிகவும் முக்கியம், எனவே லேபிள் வரிசை உருவாக்கப்படும் ஒழுங்கை சரிபார்க்க உறுதியாக இருங்கள்!

பை வரைபடம்

டோனட்கள்!

ஒரு சிறிது காட்சிப்படுத்துவதற்கு 흥미க்கூடிய பை வரைபடம் என்பது டோனட் வரைபடம், இது நடுவில் ஒரு துளையுடன் கூடிய பை வரைபடம். இந்த முறையைப் பயன்படுத்தி உங்கள் தரவுகளைப் பார்ப்போம்.

காளான்கள் வளரும் பல்வேறு வாழிடங்களைப் பாருங்கள்:

habitat=mushrooms.groupby(['habitat']).count()
habitat

இங்கு, உங்கள் தரவுகளை வாழிடத்தின் படி குழுவாக்குகிறீர்கள். 7 வாழிடங்கள் பட்டியலிடப்பட்டுள்ளன, எனவே உங்கள் டோனட் வரைபடத்திற்கான லேபிள்களாக அவற்றைப் பயன்படுத்துங்கள்:

labels=['Grasses','Leaves','Meadows','Paths','Urban','Waste','Wood']

plt.pie(habitat['class'], labels=labels,
        autopct='%1.1f%%', pctdistance=0.85)
  
center_circle = plt.Circle((0, 0), 0.40, fc='white')
fig = plt.gcf()

fig.gca().add_artist(center_circle)
  
plt.title('Mushroom Habitats')
  
plt.show()

டோனட் வரைபடம்

இந்த குறியீடு ஒரு வரைபடத்தையும் ஒரு மைய வட்டத்தையும் வரைகிறது, பின்னர் அந்த மைய வட்டத்தை வரைபடத்தில் சேர்க்கிறது. மைய வட்டத்தின் அகலத்தை 0.40 ஐ மற்றொரு மதிப்பாக மாற்றுவதன் மூலம் திருத்துங்கள்.

டோனட் வரைபடங்களை பல வழிகளில் மாற்றி லேபிள்களை மாற்றலாம். குறிப்பாக, லேபிள்களை வாசிக்க எளிதாக்கலாம். மேலும் docs இல் அறிக.

இப்போது உங்கள் தரவுகளை குழுவாக்கி அதை பை அல்லது டோனட் வடிவில் காட்சிப்படுத்துவது எப்படி என்பதை நீங்கள் அறிந்துள்ளீர்கள், நீங்கள் மற்ற வகையான வரைபடங்களை ஆராயலாம். வாஃபிள் வரைபடத்தை முயற்சிக்கவும், இது அளவுகளை 2D சதுரங்களின் வரிசையாக காட்சிப்படுத்தும் ஒரு வேறுபட்ட வழியாகும்.

வாஃபிள்கள்!

'வாஃபிள்' வகை வரைபடம் என்பது அளவுகளை 2D சதுரங்களின் வரிசையாக காட்சிப்படுத்தும் ஒரு வேறுபட்ட வழியாகும். இந்த தரவுத்தொகுப்பில் காளான் தொப்பி நிறங்களின் வெவ்வேறு அளவுகளை காட்சிப்படுத்த முயற்சிக்கவும். இதைச் செய்ய, PyWaffle எனும் உதவிக் நூலகத்தை நிறுவி Matplotlib ஐப் பயன்படுத்தவும்:

pip install pywaffle

உங்கள் தரவின் ஒரு பகுதியைத் தேர்ந்தெடுத்து குழுவாக்கவும்:

capcolor=mushrooms.groupby(['cap-color']).count()
capcolor

லேபிள்களை உருவாக்கி உங்கள் தரவுகளை குழுவாக்குவதன் மூலம் ஒரு வாஃபிள் வரைபடத்தை உருவாக்கவும்:

import pandas as pd
import matplotlib.pyplot as plt
from pywaffle import Waffle
  
data ={'color': ['brown', 'buff', 'cinnamon', 'green', 'pink', 'purple', 'red', 'white', 'yellow'],
    'amount': capcolor['class']
     }
  
df = pd.DataFrame(data)
  
fig = plt.figure(
    FigureClass = Waffle,
    rows = 100,
    values = df.amount,
    labels = list(df.color),
    figsize = (30,30),
    colors=["brown", "tan", "maroon", "green", "pink", "purple", "red", "whitesmoke", "yellow"],
)

வாஃபிள் வரைபடத்தைப் பயன்படுத்தி, இந்த காளான் தரவுத்தொகுப்பின் தொப்பி நிறங்களின் விகிதங்களை தெளிவாகக் காணலாம். 흥미க்கூடாக, பல பச்சை-தொப்பி காளான்கள் உள்ளன!

வாஃபிள் வரைபடம்

✅ Pywaffle Font Awesome இல் கிடைக்கும் எந்த ஐகானையும் பயன்படுத்தும் வரைபடங்களில் ஐகான்களை ஆதரிக்கிறது. சதுரங்களுக்குப் பதிலாக ஐகான்களைப் பயன்படுத்தி மேலும் 흥미க்கூடிய வாஃபிள் வரைபடத்தை உருவாக்க சில பரிசோதனைகளைச் செய்யுங்கள்.

இந்த பாடத்தில், நீங்கள் விகிதங்களை காட்சிப்படுத்த மூன்று வழிகளை கற்றுக்கொண்டீர்கள். முதலில், உங்கள் தரவுகளை வகைகளாகக் குழுவாக்க வேண்டும், பின்னர் தரவுகளை காட்சிப்படுத்த சிறந்த வழி எது என்பதைத் தீர்மானிக்க வேண்டும் - பை, டோனட் அல்லது வாஃபிள். அனைத்தும் சுவையானவை மற்றும் ஒரு தரவுத்தொகுப்பின் உடனடி கண்ணோட்டத்தை வழங்கி பயனரை மகிழ்விக்கின்றன.

🚀 சவால்

இந்த சுவையான வரைபடங்களை Charticulator இல் மீண்டும் உருவாக்க முயற்சிக்கவும்.

மதிப்பீடு & சுயபடிப்பு

எப்போது பை, டோனட் அல்லது வாஃபிள் வரைபடத்தைப் பயன்படுத்த வேண்டும் என்பது சில நேரங்களில் தெளிவாக இருக்காது. இந்த தலைப்பில் படிக்க சில கட்டுரைகள் இங்கே:

https://www.beautiful.ai/blog/battle-of-the-charts-pie-chart-vs-donut-chart

https://medium.com/@hypsypops/pie-chart-vs-donut-chart-showdown-in-the-ring-5d24fd86a9ce

https://www.mit.edu/~mbarker/formula1/f1help/11-ch-c6.htm

https://medium.datadriveninvestor.com/data-visualization-done-the-right-way-with-tableau-waffle-chart-fdf2a19be402

இந்த சிக்கலான முடிவைப் பற்றிய மேலும் தகவல்களைத் தேடி ஆராயுங்கள்.

பணிக்கட்டளை

Excel இல் முயற்சிக்கவும்


குறிப்பு:
இந்த ஆவணம் Co-op Translator என்ற AI மொழிபெயர்ப்பு சேவையைப் பயன்படுத்தி மொழிபெயர்க்கப்பட்டுள்ளது. நாங்கள் துல்லியத்திற்காக முயற்சிக்கிறோம், ஆனால் தானியக்க மொழிபெயர்ப்புகளில் பிழைகள் அல்லது தவறான தகவல்கள் இருக்கக்கூடும் என்பதை கவனத்தில் கொள்ளவும். அதன் தாய்மொழியில் உள்ள மூல ஆவணம் அதிகாரப்பூர்வ ஆதாரமாக கருதப்பட வேண்டும். முக்கியமான தகவல்களுக்கு, தொழில்முறை மனித மொழிபெயர்ப்பு பரிந்துரைக்கப்படுகிறது. இந்த மொழிபெயர்ப்பைப் பயன்படுத்துவதால் ஏற்படும் எந்த தவறான புரிதல்கள் அல்லது தவறான விளக்கங்களுக்கு நாங்கள் பொறுப்பல்ல.