Kurs 2
Überblick über das Portfolio-Projekt am Ende des Kurses 2: TikTok
Erfahren Sie mehr über das TikTok-Arbeitsplatzszenario von Kurs 2!
Das Abschlussprojekt in Kurs 2 konzentriert sich auf Ihre Fähigkeit, die für ein Projekt erforderlichen Daten zu verstehen. Zur Erinnerung: In Kurs 1 haben Sie einen Projektvorschlag entwickelt, der Meilensteine darlegt, die mit jedem der Abschlussprojekte voranschreiten. Eine visuelle Darstellung bietet die hier gezeigte Grafik:
Erfahren Sie in dieser Lektüre mehr über das Projekt, Ihre Rolle und Ihre Erwartungen.
Hintergrund zum TikTok-Szenario
Bei TikTok ist es unsere Mission, Kreativität anzuregen und Freude zu bereiten. Unsere Mitarbeiter führen mit Neugier und bewegen sich im Tempo der Kultur. In Kombination mit der flachen Struktur unseres Unternehmens erhalten Sie dynamische Möglichkeiten, einen echten Einfluss auf ein schnell wachsendes Unternehmen zu nehmen und Ihre Karriere voranzutreiben.
TikTok-Benutzer haben die Möglichkeit, Berichte einzureichen, die Videos und Kommentare identifizieren, die Benutzeransprüche enthalten. Diese Berichte identifizieren Inhalte, die von Moderatoren überprüft werden müssen. Der Prozess generiert eine große Anzahl von Benutzerberichten, deren rechtzeitige Berücksichtigung schwierig ist.
TikTok arbeitet an der Entwicklung eines Vorhersagemodells, das feststellen kann, ob ein Video eine Behauptung enthält oder eine Meinung abgibt. Mit einem erfolgreichen Vorhersagemodell kann TikTok den Rückstand an Benutzerberichten reduzieren und diese effizienter priorisieren.
Hintergrund des Projekts
Das Datenteam von TikTok befindet sich im Anfangsstadium des Schadenklassifizierungsprojekts. Die folgenden Aufgaben sind erforderlich, bevor das Team mit der Datenanalyse beginnen kann:
Erstellen Sie einen Datenrahmen für den TikTok-Datensatz
Untersuchen Sie den Datentyp jeder Spalte
Sammeln Sie deskriptive Statistiken
Ihre Aufgabe
Sie erstellen einen Datenrahmen für die Schadenklassifizierungsdaten. Nachdem der Datenrahmen fertig ist, organisieren Sie die Schadendaten für den Prozess der explorativen Datenanalyse und informieren das Team über Ihre Fortschritte und Erkenntnisse.
Teammitglieder bei TikTok
Rollen des Datenteams
Willow Jaffey – Leiterin der Datenwissenschaft
Rosie Mae Bradshaw – Data Science Manager
Orion Rainier – Datenwissenschaftler
Die Mitglieder des Datenteams von TikTok sind mit Datenanalyse und Datenwissenschaft bestens vertraut. Nachrichten an diese eher technischen Kollegen sollten prägnant und spezifisch sein.
Funktionsübergreifende Teammitglieder
Mary Joanna Rodgers – Projektmanagementbeauftragte
Margery Adebowale – Finanzleiterin, Amerika
Maika Abadi – Betriebsleiterin
Zu Ihrem TikTok-Team gehören mehrere Manager, die den Betrieb überwachen. Es ist wichtig, Ihre allgemeine Korrespondenz angemessen an ihre Rollen anzupassen, da ihre Aufgaben weniger technischer Natur sind.
Hinweis: Die Geschichte, alle Namen, Charaktere und Vorfälle, die in diesem Projekt dargestellt werden, sind frei erfunden. Eine Identifizierung mit tatsächlichen Personen (lebend oder verstorben) ist nicht beabsichtigt oder sollte abgeleitet werden. Und die in diesem Projekt geteilten Daten wurden für pädagogische Zwecke erstellt.
Spezifische Projektergebnisse
Mit diesem Abschlussprojekt erwerben Sie wertvolle Praxis und wenden Ihre neuen Fähigkeiten an, während Sie Folgendes absolvieren:
Kurs 2 PACE-Strategiedokument zur Planung Ihres Projekts unter Berücksichtigung Ihrer Zielgruppe, Teamkollegen, wichtiger Meilensteine und des Gesamtprojektziels.
Beantworten Sie die Fragen in der Jupyter-Notebook-Projektdatei
Schließen Sie die Codierungsvorbereitungsarbeiten am Jupyter-Notebook des Projekts ab
Fassen Sie die Spalten-Dtypes zusammen
Kommunizieren Sie wichtige Erkenntnisse in Form einer Executive Summary
Das Datenteam von TikTok benötigt Sie, um Probleme zu lösen und Ihre Ergebnisse zu kommunizieren. Viel Glück bei deinen Aufgaben!
Die zentralen Thesen
Das Abschlussprojekt für das Google Advanced Data Analytics-Zertifikat ist für Sie konzipiert, um Kursfähigkeiten in einem fiktiven Arbeitsplatzszenario zu üben und anzuwenden. Wenn Sie das Abschlussprojekt jedes Kurses abschließen, erhalten Sie Arbeitsbeispiele, die Ihr Portfolio erweitern und Ihre Fähigkeiten für zukünftige Arbeitgeber präsentieren.
Activity Overview
In this activity, you will complete a project that showcases your ability to use Python to import, inspect, and organize data. You will also update team members through an executive summary, demonstrating your ability to organize and communicate key information.
For additional information on how to complete this activity, review the previous readings: End-of-course project introduction and Course 2 end-of-course portfolio project overview: TikTok.
Be sure to complete this activity before moving on. The next course item will provide you with completed exemplars to compare to your own work. You will not be able to access the exemplars until you have completed this activity.
The team’s latest project is in its early stages of developing a machine learning model to classify claims in videos.
Previously, you were asked to complete a project proposal by your supervisor, Rosie Mae Bradshaw. You have received notice that the project proposal submitted by the team has been approved and your team has been given access to TikTok’s user data. To get clear insights, the data must be inspected, organized, and prepared for analysis.
You discover two new emails in your inbox: one from your supervisor, Rosie Mae Bradshaw, and one from Willow Jaffey, the data team’s Data Science Lead. Review the emails, then follow the provided instructions to complete the PACE strategy document, the code notebook, and the executive summary.
Note: Team member names used in this workplace scenario are fictional and are not representative of TikTok.
Email from Rosie Mae Bradshaw, Data Science Manager
Subject: Help with coding notebook?
From: “Bradshaw, Rosie Mae” —rosiemaebradshaw@tiktok
Cc: “Rainier, Orion”—orionrainier@tiktok
Good morning,
I have a couple of updates on our latest project. The leadership team has approved the project proposal that we completed previously. Thanks for all of your great work so far. Additionally, I just received an email from our Project Management Officer, Mary Joanna Rodgers that the data team is clear to proceed.
Before we begin the process of Exploratory Data Analysis (EDA), we could really use your help with coding and prepping the data. During your interview you mentioned that you worked with Python specifically in the Google certificate program you completed. That experience sounds applicable here.
Orion Rainier (Cc’d above) started a Jupyter notebook with the relevant dataset (attached). Orion is very involved in the final stages of another project. I’m sure your assistance in completing the coding and setting up the notebook for the project would be greatly appreciated.
Orion, do you mind sharing the details?
Humblest regards,
Rosie Mae Bradshaw
Data Science Manager
Learn about TikTok’s Trust & Safety team
Email from Orion Rainier, Data Scientist
Subject: RE: Help with coding notebook?
From: “Rainier, Orion”—orionrainier@tiktok
Cc: “Bradshaw, Rosie Mae” —rosiemaebradshaw@tiktok
Nice to meet you (virtually)!
Hope you have enjoyed your first few weeks!
With the project proposal approved, we are ready to begin the process of preparing the claim classification data. The goal of this project is to ultimately build a machine learning model that can streamline the claims process by identifying whether statements made in videos are claims or opinions.
A claim refers to information that is either unsourced or from an unverified source. For example, “The news reported that someone revealed that around 50% of the mined gold on Earth comes from one source.”
Opinions refer to the personal beliefs or thoughts of a group or an individual. Here’s an example, “In my opinion the most productive work day of the week is Tuesday.”
There are a number of data team members committed to adjusting the machine learning developed for the last project, so your help is greatly appreciated!
Until we finish the prior project, there is no need to do a full EDA on this data. We will get to that soon. Do you mind importing the data (attached) and reviewing it for the team? It would be fantastic if you could include a summary of the column Data types, data value nonnull counts, relevant and irrelevant columns, along with anything else code related you think is worth sharing/showing in the notebook? You’ll need to select a couple of variables to focus on. Include their minimum and maximum values. I haven’t looked closely at the data yet, but it would be really helpful if you can create meaningful variables by combining or modifying the structures given.
Orion Rainier
Data Scientist
“Big data isn’t about bits, it’s about talent.” — Douglas Merrill
Links to templates:
Activity_Course 2 TikTok project lab.ipynb