Kurs 2
Überblick über das Portfolio-Projekt am Ende des Kurses 2: Automatidata
Erfahren Sie mehr über das Arbeitsplatzszenario von Kurs 2 Automatidata!
Das Abschlussprojekt in Kurs 2 konzentriert sich auf Ihre Fähigkeit, die für ein Projekt erforderlichen Daten zu verstehen. Zur Erinnerung: In Kurs 1 haben Sie einen Projektvorschlag entwickelt, der Meilensteine darlegt, die mit jedem der Abschlussprojekte voranschreiten. Eine visuelle Darstellung bietet die hier gezeigte Grafik:
Erfahren Sie in dieser Lektüre mehr über das Projekt, Ihre Rolle und Ihre Erwartungen.
Hintergrund zum Automatidata-Szenario
Automatidata arbeitet mit seinen Kunden zusammen, um deren ungenutzte und gespeicherte Daten in nützliche Lösungen wie Leistungs-Dashboards, kundenorientierte Tools, strategische Geschäftseinblicke und mehr umzuwandeln. Sie sind darauf spezialisiert, die Geschäftsanforderungen eines Kunden zu ermitteln und ihre Daten zur Erfüllung dieser Geschäftsanforderungen zu nutzen.
Automatidata berät die New York City Taxi and Limousine Commission (TLC). New York City TLC ist eine Behörde, die für die Lizenzierung und Regulierung der Taxis und Mietfahrzeuge in New York City zuständig ist. Die Agentur hat mit Automatidata zusammengearbeitet, um ein Regressionsmodell zu entwickeln, das dabei hilft, die Taxipreise vor der Fahrt auf der Grundlage der von TLC gesammelten Daten abzuschätzen.
Die TLC-Daten stammen von über 200.000 Taxi- und Limousinenlizenznehmern, die zusammen etwa eine Million Fahrten pro Tag durchführen.
Hinweis: Der Datensatz dieses Projekts wurde zu pädagogischen Zwecken erstellt und gibt möglicherweise keinen Aufschluss über das Verhalten von Taxifahrern in New York City.
Teammitglieder bei Automatidata und dem New York City TLC
Mitglieder des Automatidata-Teams
Udo Bankole, Leiter Datenanalyse
Deshawn Washington, Datenanalysemanager
Luana Rodriquez, leitende Datenanalystin
Uli King, Senior Projektmanager
Ihre Teamkollegen bei Automatidata verfügen über technische Erfahrung mit Datenanalyse und Datenwissenschaft. Sie sollten jedoch immer darauf achten, Zusammenfassungen und Nachrichten an diese Teammitglieder prägnant und auf den Punkt zu bringen.
Mitglieder des TLC-Teams von New York City
Juliana Soto, Leiterin der Abteilung Finanzen und Verwaltung
Titus Nelson, Betriebsleiter
Die Mitglieder des TLC-Teams sind Programmmanager, die den Betrieb der Organisation überwachen. Ihre Rollen sind nicht sehr technisch, also passen Sie Ihre Sprache und Erklärung entsprechend an.
Hinweis: Die Geschichte, alle Namen, Charaktere und Vorfälle, die in diesem Projekt dargestellt werden, sind frei erfunden. Eine Identifizierung mit tatsächlichen Personen (lebend oder verstorben) ist nicht beabsichtigt oder sollte abgeleitet werden. Und die in diesem Projekt geteilten Daten wurden für pädagogische Zwecke erstellt.
Hintergrund des Projekts
Automatidata befindet sich im Anfangsstadium des TLC-Projekts. Die folgenden Aufgaben sind erforderlich, bevor das Team mit der Datenanalyse beginnen kann:
Erstellen Sie einen Datenrahmen für den TLC-Datensatz
Untersuchen Sie den Datentyp jeder Spalte
Sammeln Sie deskriptive Statistiken
Ihre Aufgabe
Sie erstellen einen Datenrahmen für die TLC-Daten. Nachdem der Datenrahmen fertiggestellt ist, organisieren Sie die Daten für den Prozess der explorativen Datenanalyse und halten das Team über Ihre Fortschritte und Erkenntnisse auf dem Laufenden.
Spezifische Projektergebnisse
Mit diesem Abschlussprojekt erwerben Sie wertvolle Praxis und wenden Ihre neuen Fähigkeiten an, während Sie Folgendes absolvieren:
Füllen Sie die Fragen im PACE-Strategiedokument für Kurs 2 aus
Beantworten Sie die Fragen in der Jupyter-Notebook-Projektdatei
Schließen Sie die Codierungsvorbereitungsarbeiten am Jupyter-Notebook des Projekts ab
Fassen Sie die Spalten-Dtypes zusammen
Teilen Sie DeShawn und Luana wichtige Erkenntnisse in Form einer Zusammenfassung mit
Viel Glück mit diesem Projekt! Automatidata freut sich darauf, zu sehen, wie Sie Ihre kreative Arbeit kommunizieren und Problemlösungen angehen!
Die zentralen Thesen
Das Abschlussprojekt für das Google Advanced Data Analytics-Zertifikat ist für Sie konzipiert, um Kursfähigkeiten in einem fiktiven Arbeitsplatzszenario zu üben und anzuwenden. Wenn Sie das Abschlussprojekt jedes Kurses abschließen, erhalten Sie Arbeitsbeispiele, die Ihr Portfolio erweitern und Ihre Fähigkeiten für zukünftige Arbeitgeber präsentieren.
Aktivitätsübersicht
In dieser Aktivität schließen Sie ein Projekt ab, das Ihre Fähigkeit demonstriert, Python zum Importieren, Überprüfen und Organisieren von Daten zu verwenden. Außerdem halten Sie die Teammitglieder durch eine Zusammenfassung auf dem Laufenden und demonstrieren so Ihre Fähigkeit, wichtige Informationen zu organisieren und zu kommunizieren.
Weitere Informationen zur Durchführung dieser Aktivität finden Sie in den vorherigen Lektüren:Einführung in das Portfolioprojekt am Ende des KursesUndÜberblick über das Portfolio-Projekt am Ende des Kurses 2: Automatidata.
Stellen Sie sicher, dass Sie diese Aktivität abgeschlossen haben, bevor Sie fortfahren. Im nächsten Kurspunkt erhalten Sie fertige Beispiele zum Vergleich mit Ihrer eigenen Arbeit. Sie können erst dann auf die Exemplare zugreifen, wenn Sie diese Aktivität abgeschlossen haben.
Szenario
Sie sind das neueste Mitglied des Datenanalyseteams von Automatidata. Ihr Team befindet sich noch in der Anfangsphase seines Projekts für die New York City Taxi & Limousine Commission (TLC).
Zuvor wurden Sie von Ihrem Vorgesetzten, Deshawn Washington, gebeten, einen Projektvorschlag auszufüllen. Sie haben die Mitteilung erhalten, dass Ihr Projektvorschlag genehmigt wurde und dass TLC dem Automatidata-Team Zugriff auf seine Daten für Forschungszwecke gewährt hat. Glückwunsch! Um klare Erkenntnisse zu gewinnen, müssen die Daten von TLC analysiert, Schlüsselvariablen identifiziert und sichergestellt werden, dass der Datensatz für die Analyse bereit ist.
Sie entdecken zwei neue E-Mails in Ihrem Posteingang: eine von Ihrem Vorgesetzten Deshawn Washington und eine von Ihrer Teamkollegin Luana Rodriguez. Überprüfen Sie die E-Mails und befolgen Sie dann die bereitgestellten Anweisungen, um das PACE-Strategiedokument, das Code-Notizbuch und die Zusammenfassung auszufüllen.
Hinweis: Die in diesem Arbeitsplatzszenario verwendeten Namen der Teammitglieder sind fiktiv und nicht repräsentativ für das New York City TLC.
______________________________________________
E-Mail von Deshawn Washington, Datenanalysemanager
Betreff: Hilfe beim Programmiernotizbuch?
Von: „Deshawn Washington“, Deshawn@automatidata.com
Cc: „Luana Rodriquez“ Luana@automatidata.com
Guten Morgen Team,
Ich habe ein paar Updates zum TLC-Projekt. Der von Ihnen zuvor abgeschlossene Projektvorschlag wurde genehmigt. Vielen Dank für all Ihre großartige Arbeit bisher. Außerdem habe ich gerade eine E-Mail von unserem Senior-Projektmanager Uli King erhalten, dass TLC unserem Team Zugriff auf seine Daten gewährt hat.
Bevor wir mit dem Prozess der explorativen Datenanalyse (EDA) beginnen, könnten wir Ihre Hilfe bei der Codierung und Vorbereitung der Daten wirklich gebrauchen. Während Ihres Interviews haben Sie erwähnt, dass Sie während des Google Career Certificate-Programms mit Python gearbeitet haben. Diese Erfahrung scheint hier anwendbar zu sein.
Luana (Cc’d) startete ein Jupyter-Notizbuch mit dem relevanten Datensatz von TLC (im Anhang). Sie befindet sich derzeit in der Endphase eines anderen Projekts. Ich bin mir sicher, dass sie Ihre Hilfe beim Abschluss der Codierung und beim Einrichten des Notizbuchs für das TLC-Projekt gebrauchen könnte.
Luana, würde es dir etwas ausmachen, die Details mitzuteilen?
Herzliche Grüße,
Deshawn Washington
Datenanalysemanager
Automatisierte Daten
E-Mail von Luana Rodriquez, Senior Data Analyst
Betreff: RE: Hilfe beim Programmiernotizbuch?
Von: „Luana Rodriquez“ Luana@automatidata
Cc: „Deshawn Washington“, Deshawn@automatidata
Schön, Sie (virtuell) kennenzulernen!
Ich hoffe, Sie haben die ersten Wochen genossen!
Der Projektvorschlag, bei dessen Erstellung Sie mitgeholfen haben, deckt die wichtigsten Punkte dieses Projekts ab, daher komme ich gleich dazu, wie Sie das Team unterstützen können. Einige von uns nehmen Anpassungen am maschinellen Lernen vor, das für den letzten Kunden entwickelt wurde, daher sind wir für Ihre Hilfe sehr dankbar!
Bis wir das vorherige Projekt abgeschlossen haben, besteht keine Notwendigkeit, eine vollständige EDA für diese Daten durchzuführen. Dazu kommen wir bald. Würde es Ihnen etwas ausmachen, die TLC-Daten zu überprüfen, die wir für das Team erhalten haben? Es wäre fantastisch, wenn Sie eine Zusammenfassung der Spalten-D-Typen, der Anzahl der Datenwerte ungleich Null, der relevanten und irrelevanten Spalten sowie alles andere, was mit Code zu tun hat, in das Notizbuch aufnehmen könnten, was Ihrer Meinung nach wert ist, geteilt zu werden? Es wäre wirklich hilfreich, wenn Sie sinnvolle Variablen erstellen könnten, indem Sie die angegebenen Strukturen kombinieren oder ändern.
Danke,
Luana Rodriquez
Leitender Datenanalyst
Automatisierte Daten
Schritt für Schritt Anweisungen
Befolgen Sie die Anweisungen, um die Aktivität abzuschließen. Fahren Sie dann mit dem nächsten Kurspunkt fort, um Ihre Arbeit mit einem fertigen Exemplar zu vergleichen.
Links zu Vorlagen:
Vorlagen für Executive Summary
Activity_Course 2 Automatidata project lab.ipynb
Completed Exemplars