Ресурс

Решихме да предложим на вашето внимание един класически набор от данни (дейтасет) за поръчки на артикули от клиенти на голям хипермаркет. Включени са 9994 записа с данни. Следва да уточним, че данните са на английски език, но смятаме, че това не е никакъв проблем за вас. Въпреки това в следващите редове ще намерите кратко описание на съдържанието на отделните колони с данни.

  • Row ID – пореден номер на записа с данни
  • Order ID – уникален идентификационен номер на поръчката (забележете, че една поръчка може да е описана на няколко реда, защото включва различни артикули в нея)
  • Order Date – дата на извършване на поръчката
  • Ship Date – дата на изпращане на поръчаните артикули
  • Ship Mode – вид на доставката до клиента (например нормална, бърза, експресна)
  • Customer ID – уникален идентификационен номер на клиента
  • Customer Name – имена на клиента
  • Segment – вид на клиента (например физическо лице, юредическо лице)
  • Country – държава, от където е клиентът (всички са от САЩ)
  • City – град, където живее клиентът
  • State – щат, където живее клиентът
  • Postal Code – пощенски код на населеното място, където живее клиентът
  • Region – регион от страната, където живее клиентът
  • Product ID – уникален идентификационен номер на поръчания артикул
  • Category – категория на поръчания артикул
  • Sub-Category – подкатегория на поръчания артикул
  • Product Name – наименование на поръчания артикул
  • Sales – единична цена на поръчания артикул
  • Quantity – поръчано количество от артикула
  • Discount – направена отстъпка при поръчката на артикула (0 – без отстъпка; 0,1 => 10% отстъпка; 0,2 => 20% отстъпка и т.н. )
  • Profit – реализирана печалба/загуба за магазина от продажбата на артикула

Предоставяме ви дейтасета с реалните данни в два основни файлови формата:

xlsx-файл – познатият ви файлов формат на Microsoft Excel, с който сте достатъчно запознати.
Изтеглете SuperstoreOrders.xlsx

csv-файл – CSV (Comma-Separated Values) е текстов файлов формат, предназначен за показване на таблични данни. В него всеки един ред представлява отделен запис. Всеки запис се състои от една или няколко стойности, разделени със запетая. Именно тези запетаи-разделитети, определят и броя на колоните с данни. Първият ред на csv файла винаги описва имената на колоните на табличните данни, които се представят. Предоставяме този формат на данните, защото той се използва като източник на данни от значителен брой приложения за анализиране и визуализиране на данни.
Изтеглете SuperstoreOrders.csv

Знаем условието, свалили сме данните, можем да се насочим към информацията за първи кръг на състезанието. И не забравяйте да се регистрирате за участие.