Skip to content

Latest commit

 

History

History
48 lines (33 loc) · 3.54 KB

README.md

File metadata and controls

48 lines (33 loc) · 3.54 KB

RAFAEL Challenge - DataHack 2017

It takes a rocket data scientist!

באתגר המצורף עליכם לזהות את סוג הרקטה מתוך מקטע מעוף שלה. הסט בנוי ממקטעי מסלולים באורכים 5-15 שניות , שתי מדידות בשניה. שימו לב! בסט האימון יש 25 סוגי מטרות אבל בסט הבחינה יש יותר. מטרות שלא הופיעו בסט האימון יש לתייג כסוג 26

ניתן לשאול אותנו שאלה באמצעות פתיחת issue

בתיקייה המצורפת תמצאו את הקבצים הבאים:

  • train.csv - סט האימון
  • test.csv - סט הבחינה
  • Submission_sample - דוגמת הגשה
  • readAndSubmit_sample.py - קובץ פייתון לדוגמא לקריאת הדאטה והכנת קובץ ההגשה
  • readAndSubmit_sample.ipynb - קובץ פייתון nb לדוגמא לקריאת הדאטה והכנת קובץ ההגשה
  • readAndSubmit_sample.m - קובץ מטלאב לדוגמא לקריאת הדאטה והכנת קובץ ההגשה
  • csv2kml.py - קובץ פייתון לדוגמא המייצר מתוך דאטה חלקי קובץ ויזואליזציה עבור Google Earth
  • csv2kml.m - קובץ מטלאב לדוגמא המייצר מתוך דאטה חלקי קובץ ויזואליזציה עבור Google Earth
  • Picture1.png - דוגמא לויזואליזציה שנוצרה באמצעות הקבצים הנ"ל

שימו לב: קבצי הפייתון נבדקו בסביבת פייתון 2.7. קבצי המטלאב נבדקו בגרסא 2014a

חוקי האתגר:

  • על קובץ ההגשה להיות באותו פורמט כמו בדוגמה המצורפת
  • ניתן להגיש עד 3 הגשות במהלך ההאקתון.
    • להגשה יש לשלוח את קובץ ההגשה למייל RocketDataScientist@gmail.com
    • בכותרת יש לכתוב submission: TeamName. במקום TeamName יש לרשום את שם הקבוצה.
  • הגשה אחרונה תינתן עד יום שישי 27/10, שעה 9:00. לאחר מכן לא תתקבלנה הגשות.
  • תוצאות ביניים להגשות תתקבלנה במייל חוזר בהקדם האפשרי (בכל זמן שנציג החברה יהיה בהאקתון) עד יום חמישי 26/10 בשעה 21:00
  • ציון סט הבחינה יחושב ע"י ה f1-score הממוצע, כאשר הקבוצה עם הציון הגבוה ביותר היא המנצחת.

מידע על בסיס הנתונים:

  • 300,000 מקטעי מסלולים, בין 5 ל 15 שניות, עם תדר דגימה של 2 הרץ (דגימה כל חצי שנייה). בכל דגימה נתוני מיקום XYZ ומהירות XYZ מורעשים.
  • כל מקטעי המסלולים מיושרים לכיוון המהירות ההתחלתית ומתחילים מ X=0, Y=0 ובגובה האמיתי. הכיוון החיובי של ציר Z הוא כלפי מעלה, כלומר VelZ חיובי מציין מטרה בעלייה
  • סט האימון הינו כ-10% מתוך בסיס הנתונים ומכיל מסלולים מתויגים ל 25 סוגים.
  • סט הבחינה הינו כ 90% מתוך בסיס הנתונים ואותו נדרש לסווג ל 26 מסלולים - הכוונה ל 25 המסלולים מסט האימון וסיווג מספר 26 לכל מסלול אשר מתקבלת עבורו החלטה שלא לסווגו לאף אחד מ 25 המסלולים