Pārskats: Udacity Data Analyst Nanodegree programma

Udacity Data Analyst Nanodegree programma bija viena no pirmajām tiešsaistes datu zinātnes programmām tiešsaistes izglītības revolūcijā. Tās mērķis ir "nodrošināt, ka jūs apgūstat precīzas prasmes, kas nepieciešamas, lai izveidotu karjeru datu zinātnē". Vai tas sasniedz savu mērķi? Vai tas ir labākais pieejamais variants?

Es pabeidzu programmu 2016. gada rudenī. Izmantojot iedvesmu no Class Central atvērtā pirmkoda pārskata veidnes, šeit ir mans pārskats par programmu Udacity Data Analyst Nanodegree.

ATJAUNINĀJUMS: 2017. gada septembrī programma Data Analyst Nanodegree tika atsvaidzināta ar jaunu saturu un studentu pakalpojumiem. Sīkāka informācija šeit. Mani arī uzņēma, lai palīdzētu atjaunot daļu šī jaunā satura. Šī pārskata lielākā daļa nav mainīta. Faktiskie atjauninājumi ir norādīti kursīvā.

Pamatinformācija

Kas man lika izvēlēties šo programmu?

2016. gada sākumā es sāku veidot savu datu zinātnes maģistra programmu, izmantojot tiešsaistes resursus. (Par to varat lasīt šeit.) Es reģistrējos Data Analyst Nanodegree programmā dažu iemeslu dēļ:

  • Es gribēju ceļvedi ievadam datu zinātnē.
  • Es gribēju saliedētu programmu, nevis atsevišķus kursus no dažādiem pakalpojumu sniedzējiem.
  • Tas saņēma zvaigžņu atsauksmes.
  • Iepriekš biju izgājis dažus Udacity kursus, un es biju viņu mācību stila cienītājs.

Kādi bija mani mērķi?

Lai gan programma var darboties kā tilts uz darbu (par to vēlāk), es gribēju izmantot programmu kā ievadu progresīvākam materiālam. Šis “progresīvākais materiāls” attiecas gan uz priekšmetiem, uz kuriem attiecas programma, gan uz priekšmetiem, kas nav iekļauti.

Kas ir Udacity Nanodegree programma?

Udacity ir viens no vadošajiem tiešsaistes izglītības nodrošinātājiem. Sebastians Thruns, bijušais Stenfordas profesors un Google X dibinātājs, nodibināja uzņēmumu un koncentrējas uz inovācijām Udacity kā prezidents un priekšsēdētājs. Vish Makhijani ir izpilddirektors.

Nanodegree programmas ir tiešsaistes akreditācijas dati, ko nodrošina Udacity. Tie ir Udacity kursu apkopojumi (daži ir pieejami bez maksas, citi nav), kuriem ir pievienoti projekti, kurus pārskata Udacity apmaksātie projektu recenzenti. Viņi arī nāk ar virkni studentu pakalpojumu.

Slack tiek izmantots kā kopienas rīks, kurā Udacity studenti var mijiedarboties ar citiem studentiem, kā arī ar viņu programmas pasniedzējiem un citiem Udacity darbiniekiem. Lielākajā daļā programmu studenti ir norīkojuši mentorus un sazinās ar viņiem, izmantojot privātu tērzēšanas kanālu, kas vienmēr ir pieejams Udacity klasē.

Programma Data Analyst Nanodegree sākotnēji tika izlaista 2014. gadā. Tā bija otrā Udacity Nanodegree programma. Lai gan gadu gaitā tajā ir notikušas dažas izmaiņas, programmas pamats ir neskarts.

Kas ir instruktori un kāda ir viņu izcelsme?

Tā kā programma Data Analyst Nanodegree ir Udacity kursu apkopojums (atkal daži bez maksas, citi ne), ir vairāki pasniedzēji. Viņu atsākumos bieži ietilpst prestižas lomas lielākajos tehnoloģiju uzņēmumos un grādi augstākajās ASV skolās.

Viņi paši par sevi nav “instruktori”, bet Udacity projektu recenzenti, mentori un studentu pieredzes darbinieki (kuri uzrauga Slack kopā ar instruktoriem) ir cilvēki, ar kuriem jūs visvairāk mijiedarbojaties. Viņi ir tik ļoti noderīgi. Vairāk par to vēlāk.

Izmaksas

Programma ir sadalīta divos terminos. Pirmais termiņš maksā USD 499 USD. Otrais termiņš maksā USD 699 USD. Ja jūs labi pārzināt prasmes, kuras mācāt pirmajā semestrī, varat to izlaist, pabeigt tikai otro kursu un tomēr iegūt akreditācijas apliecību.

Ieteicamie priekšnoteikumi

1. terminam Udacity iesaka studentiem pārzināt aprakstošo statistiku un viņiem ir zināma pieredze darbā ar datiem izklājlapās vai SQL.

Attiecībā uz 2. termiņu studentiem jābūt pieredzei, analizējot datus, izmantojot Python, kā arī pārliecībai par secinošo statistiku un tās lietojumiem.

Mana pieredze / prasmes, iestājoties programmā

Es sāku programmu 2016. gada maijā, kad man bija dažus mēnešus ilga programmēšanas pieredze, galvenokārt C un Python. Lielākā daļa šīs pieredzes bija no manas datu zinātnes maģistra programmas pārejas moduļa, kurā es paņēmu Hārvardas CS50: Ievads datorzinātnēs un Udacity ievadu Programmēšanas nanodegree programmai.

Es biju pabeidzis arī ķīmijas inženierzinātņu bakalaura programmu un man bija 24 mēnešus ilga ar kvantitāti saistīta darba pieredze. Tas nozīmēja, ka esmu izgājis vairākus statistikas kursus un biju apmierināts ar datiem.

Programma

Struktūra

Programma Data Analyst Nanodegree ir sadalīta divos terminos. Katram terminam ir trīs kursi un četri projekti (papildu projekts ir intro projekts, kas palīdz jums pierast pie Udacity mācību vides). Mats Leonards, programmas mācību vadītājs atsvaidzināšanas laikā, ir redzams visā programmā, kad viņš iepazīstina ar katru kursu, tā mērķi programmā un tā pasniedzēju (-iem).

Kursa saturu veido videoklipu, teksta un viktorīnu kombinācija. Saskaņā ar Udacity stilu videoklipi mēdz svārstīties no 30 sekundēm līdz piecām minūtēm. Automātiski vērtētās viktorīnas bieži seko šiem īsajiem videoklipiem. Šīs viktorīnas parasti ir vairākas izvēles, aizpildīšanas vietas vai mazas programmēšanas uzdevumi. Pēc CloudLabs iegūšanas šie programmēšanas uzdevumi tagad tiek veikti Jupyter Notebook un SQL kodēšanas vidēs Udacity klasē.

Katrā sadaļā atkal ir vērtēts projekts. Šie projekti un Udacity apmaksāto projektu recenzentu atsauksmes ir tas, kur studentiem ir liela vērtība.

Mācību programma

Manam programmas izdevumam bija septiņas daļas:

  • P1: Aprakstoša un secinoša statistika
  • P2: Ievads datu analīzē (ar NumPy un pandām)
  • P3: Datu apkarošana ar MongoDB (vai SQL)
  • P4: Izpētes datu analīze (ar R)
  • P5: ievads mašīnmācībai
  • P6: Datu vizualizācija ar D3.js
  • P7: Izveidojiet A / B testu

Jaunās programmas pirmo terminu sauc par datu analīzi ar Python un SQL . Kursi un projekti ietver:

  • Intro projekts: Izpētiet laika tendences. Lai analizētu un vizualizētu temperatūras datus, tiek izmantoti SQL un izklājlapas (vai Python / R, ja jau esat pazīstami).
  • Kurss: Ievads Python. Projekts: Izpētiet ASV Bikeshare datus.
  • Kurss: Ievads datu analīzē, kas ietver datu analīzes procesu un SQL datu analīzei. Projekts: Izpētiet datu kopu.
  • Kurss: praktiskā statistika. Projekts: analizējiet A / B testa rezultātus.

Otro terminu sauc par uzlaboto datu analīzi . Kursi un projekti ietver:

  • Intro projekts: pārbaudiet uztveres fenomenu. Aprēķiniet aprakstošo statistiku un veiciet statistikas pārbaudi datu kopai, kuras pamatā ir psiholoģiska parādība, ko sauc par Stroop efektu.
  • Kurss: datu apstrāde (ar Python). Projekts: apkarot un analizēt datus. Tas ir kurss un projekts, ko es izveidoju. ?
  • Kurss: Izpētes datu analīze (ar R). Projekts: Datu izpēte un apkopošana.
  • Kurss: Datu stāstīšana (ar Tableau). Projekts: izveidojiet tabulas stāstu.

Lielās izmaiņas ar pilnu informāciju, kas aprakstīta šajā emuāra ziņā:

  • Tagad Python tiek mācīts programmā.
  • Mašīnmācība un A / B testēšana tagad ir iekļauti kā izvēles materiāls, un vairs nav nepieciešami, lai beigtu programmu. Pamatojums: “Šīs programmas mērķis ir sagatavot jūs datu analītiķu darbiem. Mūsu pētījumi liecina, ka mašīnmācīšanās nav prasība lielākajai daļai datu analītiķu pozīciju. ” A / B testēšanas pamati tagad ir apskatīti jaunajā praktiskās statistikas kursā, sniedzot studentiem ekspozīciju, kas viņiem būs nepieciešama darbā.
  • Jauni kursi un projekti. Konkrēti, ievads datu analīzei (kas ietver Python datu analīzei un SQL datu analīzei), praktiskā statistika (māca Sebastians Thruns) un datu apkarošana.

Novērtēšana

Projekti tiek vērtēti pēc pieņemšanas / neizturēšanas (oficiāli, “atbilst specifikācijām” un “prasa izmaiņas”) saskaņā ar unikālu rubriku. Jūsu projektam jāatbilst visām rubrikas sadaļām. Ja visi jūsu projekti atbilst specifikācijām, jūs beidzat. Tas nozīmē, ka automātiski vērtētās viktorīnas netiek ieskaitītas jūsu vērtējumā.

Ja projekta iesniegšanai ir nepieciešamas izmaiņas, jūsu projekta recenzents sniegs jums praktiskas atsauksmes. Pēc šo izmaiņu ieviešanas varat to atkārtoti iesniegt. Iesniegšanas ierobežojuma nav.

Mana pieredze

Laika skala

Udacity aprēķinātais programmas Data Analyst Nanodegree programmas grafiks bija 378 stundas, kad es sāku, un tas nozīmēja, ka studentiem tās izpilde prasīja vidēji 6–7 mēnešus. Saskaņā ar Toggl (laika uzskaites lietotne), visa programma man prasīja 369 stundas piecu mēnešu laikā. Šajā laika grafikā bija paredzēts veltīt nopietnu laiku tam, lai mani projekti kļūtu kvalitatīvi, pretstatā tam, lai ražotu minimumu, lai apmierinātu atbilstības / neizdošanās rubriku.

Programma tika saīsināta 2017. gada rudens atsvaidzināšanas laikā. Jauns aprēķināts timeline ir 260 stundas . Katra semestra temps ir 10 stundas nedēļā 13 nedēļu laikā, lai gan studentiem tiek dotas 19 nedēļas katra semestra pabeigšanai.

Kā norisinājās kursa saturs?

Manam programmas izdevumam kursu saturs no P1 (Statistika), P2 (Ievads datu analīzē), P4 (Izpētes datu analīze), P5 (Mašīnmācība) un P7 (A / B testēšana) iegūst piecas zvaigznes pieci no manis. P3 (Data Wrangling) un P6 iegūst trīs ar pusi zvaigznes.

Izpētes datu analīzes saturs ar Facebook darbiniekiem (P4) bija tik izgaismojošs. Ievads mašīnmācīšanās kursos ar Sebastianu Thrunu un Keitiju Malone (P5) bija visjautrākais, kāds man bijis jebkurā tiešsaistes kursā. A / B testēšanas saturs ar Google darbiniekiem (P7) ir tik unikāls. Es, ja varētu, piešķirtu šiem trim kursiem sešas zvaigznes.

SQL un Data Wrangling saturs (P3) nebija pārsteidzošs. Tas pats ar datu vizualizācijas saturu (P6), lai gan tas, iespējams, bija tāpēc, ka D3.js ir ļoti grūti iemācīt JavaScript iesācējiem. Šie viedokļi nav nekas neparasts, liecina Class Central šo kursu atsauksmes. Pārbaudiet tos šeit un šeit.

Šis “nav pārsteidzošais” saturs no vecās programmas tika noņemts 2017. gada rudens atsvaidzināšanas laikā. Tagad ir iekļauts atjaunināts saturs datu ievadīšanas, SQL, statistikas, datu apstrādes un datu vizualizācijas ievadam. Praktiskās statistikas saturs koncentrējas uz secinošu statistiku, aprakstoša statistika ir priekšnoteikums, un tā tiek mācīta programmā Data Foundations Nanodegree. Datu vizualizācijas kurss tagad tiek pasniegts ar Tableau, nevis D3.js.

Kā noritēja projekti?

Arī šoreiz projekti ir tie, kuros Udacity sevi atšķir no pārējām tiešsaistes izglītības platformām. Viņi iegulda savā projekta izskatīšanas procesā, un tas atmaksājas. Data Analyst Nanodegree programma nebija izņēmums.

Visi projekti pastiprina videoklipos apgūto saturu. Projekta recenzenti zina savu lietu. Viņi stāsta, kur jums guva panākumus un kur ir jūsu kļūdas un / vai izlaidumi. Vadīta mācīšanās, darot. Tas strādā.

Forumi un foruma mentori ir īpaši noderīgi, ja jūs iestrēgstat. Meklējiet forumos, lai uzzinātu, vai jūsu problēma ir izplatīta (parasti tā ir). Nav laimes? Ievietojiet jaunu jautājumu pats. Ir viens foruma mentors Mīls Kallans, kurš, šķiet, zina visu par visu un reaģē dažu stundu laikā. Man ir šaubas, ka viņš guļ.

Lai gan forumi joprojām pastāv un strādā, ieteicamie atbalsta veidi ir Slack un klases padomdevēji. Studenti var izlikt jautājumus, un atbildēm tiek sniegts tāds pats vai lielāks tūlītīguma līmenis (dažu stundu laikā un bieži vien ātrāk). Slack kopienu pārrauga Udacity instruktori, kā arī viņu studentu pieredzes darbinieki, kuri nodrošina studentu jautājumu, komentāru utt. Savlaicīgu risināšanu. Slavenais Mīls Kallans tagad ir mentors.

Ja vēlaties uzzināt, kā šie projekti izskatās, apskatiet šo Github krātuvi.

Cik grūti tas bija?

Statistikas saturs man bija viegli, jo biju izgājis vairākus statistikas kursus undergrad. Tas, iespējams, attiektos uz katru Nanodegree programmas tēmu, ja jums būtu iepriekšēja pieredze tajā.

Es lielāko daļu programmas kategorizētu kā starpposma grūtības. Lekciju saturs, kurā nav daudz viktorīnu (tomēr bieži tas notiek), var būt brīze, kas nebūt nav slikta lieta. Projekti vingrina jūsu smadzenes. Katrs, iespējams, prasīs vairāk nekā divdesmit stundas, ja vēlaties būt pamatīgs.

Izpētes datu analīzes projekts bija vislielākais izaicinājums. Man bija nepieciešami 3,5 iesniegumi. Pārbaudiet šo čivināt pavedienu, lai iegūtu sīkāku informāciju.

Vai jūs varat pieteikties uz darbu uzreiz pēc skolas beigšanas?

Jūs varat. Programmai vajadzētu jums apgūt nepieciešamās iemaņas sākuma līmeņa datu analītiķa lomai, ja to uztverat nopietni. Eli Kastelein ir lielisks piemērs tam. Vairāk par viņa stāstu varat izlasīt zemāk.

Kā veidot karjeru tehnikā bez CS grāda

2014. gada pavasarī es biju jauns studijas pametis kurtu autobusā, kas īpaši nekur negāja. medium.com

Jūs varat arī turpināt kursus gan programmā, gan citos priekšmetos. To es izvēlējos darīt.

Pēdējās domas

Vai es vēlreiz lietotu programmu, zinot to, ko tagad zinu?

Kaut kur programmas beigās es sāku veidot Class Central Datu zinātnes karjeras ceļvedi. Tas ietvēra katra tiešsaistes kursa izpēti, kas tika piedāvāts katram datu zinātnes priekšmetam.

Lai gan man patika lielākā daļa Nanodegree programmas kursu (atjauninājums: jaunie kursi ir aizstājuši tos kursus, kas man nepatika) , ir arī citu pakalpojumu sniedzēju kursi, kas par konkrētiem priekšmetiem saņem labākas atsauksmes. Piemēram, statistika. Ja man būtu piekļuve savam ceļvedim, kad es sāku, es apsvērtu maršrutu katram kursam atsevišķi. Udacity studentu pakalpojumi un projektu pārskatīšanas process tomēr ir tik efektīvi, lai mācītos, neatkarīgi no tā, vai es izvēlētos programmu Data Analyst Nanodegree.

Ja jūs esat tāds cilvēks, kurš vēlas 100% pielāgotu tiešsaistes izglītības pieredzi, bet vēlaties izmantot Udacity projektus un pakalpojumus, izpētot savus iecienītos kursus par katru priekšmetu (es iesaku izmantot Class Central), pēc tam reģistrējieties Nanodegree programmā, lai pabeigtu projekti ir kaut kas jāapsver.

Alternatīvas

Šīs ir piecas alternatīvās programmas, kuras es apsvēru, iestājoties programmā Data Analyst Nanodegree:

  • Džona Hopkinsa universitātes datu zinātnes specializācija Coursera
  • Microsoft profesionālās programmas sertifikāts datu zinātnē vietnē edX
  • Vesliana universitātes datu analīzes un interpretācijas specializācija vietnē Coursera
  • DataCamp Python un R celiņi
  • Dataquest datu analītiķa un datu zinātnieka ceļi

Piezīme. Esmu noņēmis savus komentārus par šīm programmām Udacity politikas dēļ attiecībā uz citu pakalpojumu sniedzēju komentēšanu.

Secinājums

Udacity datu analītiķa programma Nanodegree sniedz jums pamatprasmes, kas nepieciešamas datu zinātnes karjerai. Pēc absolvēšanas jūs varēsiet vērsties pret stiprākajām un vājajām pusēm un vajadzības gadījumā papildināt mācības. Turklāt jūs aiziesit ar nedaudziem projektiem, kas ir gatavi portfelim.

Man patika, tāpat kā citiem.

★★★★ ¾