R ডেটা ফ্রেম: কিভাবে তৈরি করবেন, যুক্ত করবেন, নির্বাচন করুন এবং উপসেট করুন

ডেটা ফ্রেম কি?

প্রতি ডেটা ফ্রেম সমান দৈর্ঘ্যের ভেক্টরগুলির একটি তালিকা। একটি ম্যাট্রিক্সে কেবলমাত্র এক ধরণের ডেটা থাকে, যখন একটি ডেটা ফ্রেম বিভিন্ন ডেটা প্রকার (সংখ্যাসূচক, চরিত্র, ফ্যাক্টর ইত্যাদি) গ্রহণ করে।

এই টিউটোরিয়ালে আপনি শিখবেন-

কীভাবে একটি ডেটা ফ্রেম তৈরি করবেন

আমরা data.frame () ফাংশনে ভেরিয়েবল a, b, c, d দিয়ে R তে একটি ডাটাফ্রেম তৈরি করতে পারি। আমরা ডাটাফ্রেম তৈরি করতে পারি এবং নাম () দিয়ে কলামের নাম দিতে পারি এবং কেবল ভেরিয়েবলের নাম উল্লেখ করতে পারি। | _+_ |

যুক্তি :

  • df : এটি একটি ম্যাট্রিক্স হতে পারে একটি ডাটা ফ্রেম হিসেবে অথবা ভেরিয়েবলের সংগ্রহ হিসেবে যোগদান করার জন্য
  • stringsAsFactors : ডিফল্টভাবে স্ট্রিংকে ফ্যাক্টরে রূপান্তর করুন

আমরা একই দৈর্ঘ্যের চারটি ভেরিয়েবলের সমন্বয়ে আমাদের প্রথম ডেটা সেটের জন্য R- তে একটি ডেটাফ্রেম তৈরি করতে পারি। | _+_ |

আউটপুট:

data.frame(df, stringsAsFactors = TRUE) 

আমরা দেখতে পাচ্ছি যে কলাম শিরোনামের ভেরিয়েবলের মতো নাম রয়েছে। আমরা ফাংশনের নাম () দিয়ে R তে কলামের নাম পরিবর্তন করতে পারি। নীচে R তৈরি ডেটাফ্রেম উদাহরণ দেখুন: | _+_ |

আউটপুট:

 # Create a, b, c, d variables a <- c(10,20,30,40) b <- c('book', 'pen', 'textbook', 'pencil_case') c <- c(TRUE,FALSE,TRUE,FALSE) d <- c(2.5, 8, 10, 7) # Join the variables to create a data frame df <- data.frame(a,b,c,d) df 
 ## a b c d ## 1 1 book TRUE 2.5 ## 2 2 pen TRUE 8.0 ## 3 3 textbook TRUE 10.0 ## 4 4 pencil_case FALSE 7.0 

আউটপুট:

 # Name the data frame names(df) <- c('ID', 'items', 'store', 'price') df 

ডিফল্টরূপে, ডেটা ফ্রেম একটি ফ্যাক্টর হিসাবে স্ট্রিং ভেরিয়েবল প্রদান করে।

স্লাইস ডেটা ফ্রেম

ডেটা ফ্রেমের মানগুলি স্লাইস করা সম্ভব। আমরা ডাটা ফ্রেমের নাম অনুসারে বন্ধনীতে ফিরে আসার জন্য সারি এবং কলাম নির্বাচন করি।

একটি ডাটা ফ্রেম সারি এবং কলাম, df [A, B] দিয়ে গঠিত। A সারি এবং B কলাম উপস্থাপন করে। আমরা সারি এবং/অথবা কলাম নির্দিষ্ট করে স্লাইস করতে পারি।

ছবি 1 থেকে, বাম অংশটি প্রতিনিধিত্ব করে সারি, এবং ডান অংশ হল কলাম । লক্ষ্য করুন যে প্রতীক: মানে প্রতি । উদাহরণস্বরূপ, 1: 3 1 থেকে মান নির্বাচন করতে চায় প্রতি 3।

নিচের চিত্রটিতে আমরা কিভাবে ডেটা ফ্রেমের বিভিন্ন নির্বাচন অ্যাক্সেস করতে পারি তা প্রদর্শন করি:

  • হলুদ তীর নির্বাচন করে সারি 1 ইঞ্চি কলাম 2
  • সবুজ তীর নির্বাচন করে সারি 1 থেকে 2
  • লাল তীর নির্বাচন করে কলাম
  • নীল তীর নির্বাচন করে সারি 1 থেকে 3 এবং কলাম 3 থেকে 4

মনে রাখবেন, যদি আমরা বাম অংশ ফাঁকা রাখি, R নির্বাচন করবে সব সারি । সাদৃশ্য দ্বারা, যদি আমরা ডান অংশ খালি রাখি, R নির্বাচন করবে সব কলাম

আমরা কনসোলে কোড চালাতে পারি: | _+_ |

আউটপুট:

 ## ID items store price ## 1 10 book TRUE 2.5 ## 2 20 pen FALSE 8.0 ## 3 30 textbook TRUE 10.0 ## 4 40 pencil_case FALSE 7.0
 # Print the structure str(df) 

আউটপুট:

 ## 'data.frame': 4 obs. of 4 variables: ## $ ID : num 10 20 30 40 ## $ items: Factor w/ 4 levels 'book','pen','pencil_case',..: 1 2 4 3 ## $ store: logi TRUE FALSE TRUE FALSE ## $ price: num 2.5 8 10 7 
## Select row 1 in column 2 df[1,2]

আউটপুট:

## [1] book ## Levels: book pen pencil_case textbook
 ## Select Rows 1 to 2 df[1:2,]

আউটপুট:

 ## ID items store price ## 1 10 book TRUE 2.5 ## 2 20 pen FALSE 8.0

কলামগুলি তাদের নামের সাথে নির্বাচন করাও সম্ভব। উদাহরণস্বরূপ, নীচের কোড দুটি কলাম বের করে: আইডি এবং স্টোর। | _+_ |

আউটপুট:

## Select Columns 1 df[,1]

ডেটা ফ্রেমে একটি কলাম যুক্ত করুন

আপনি একটি ডেটা ফ্রেমে একটি কলাম যুক্ত করতে পারেন। ডাটাফ্রেম R ভেরিয়েবল যুক্ত করতে আপনাকে $ $ চিহ্নটি ব্যবহার করতে হবে এবং R | _+_ | এ একটি ডাটাফ্রেমে একটি কলাম যুক্ত করতে হবে।

আউটপুট:

## [1] 10 20 30 40

দ্রষ্টব্য: ভেক্টরের উপাদানগুলির সংখ্যা ডেটা ফ্রেমের উপাদানগুলির সংখ্যার সমান হতে হবে। ডাটাফ্রেম R- এ কলাম যুক্ত করতে নিম্নলিখিত বিবৃতিটি কার্যকর করা

## Select Rows 1 to 3 and columns 3 to 4 df[1:3, 3:4]

ত্রুটি দেয়:

 ## store price ## 1 TRUE 2.5 ## 2 FALSE 8.0 ## 3 TRUE 10.0

একটি ডেটা ফ্রেমের একটি কলাম নির্বাচন করুন

কখনও কখনও, ভবিষ্যতে ব্যবহারের জন্য আমাদের একটি ডেটা ফ্রেমের একটি কলাম সংরক্ষণ করতে হবে অথবা একটি কলামে অপারেশন করতে হবে। আমরা একটি ডেটা ফ্রেম থেকে কলাম নির্বাচন করতে $ চিহ্ন ব্যবহার করতে পারি। | _+_ |

আউটপুট:

# Slice with columns name df[, c('ID', 'store')]

একটি ডেটা ফ্রেম উপসেট করুন

পূর্ববর্তী বিভাগে, আমরা শর্ত ছাড়াই একটি সম্পূর্ণ কলাম নির্বাচন করেছি। এটা ও সম্ভব উপসেট একটি নির্দিষ্ট শর্ত সত্য কি না তার উপর ভিত্তি করে।

আমরা উপসেট () ফাংশন ব্যবহার করি। | _+_ |

আমরা শুধুমাত্র 10 টির উপরে মূল্য সহ আইটেমগুলি ফেরত দিতে চাই, আমরা করতে পারি: | _+_ |

আউটপুট:

 ## ID store ## 1 10 TRUE ## 2 20 FALSE ## 3 30 TRUE ## 4 40 FALSE