Question 1

データサイエンティスト履歴書には何が入りますか?

Accepted Answer

デプロイされたモデル結果を持つ逆時系列の職歴、グループ化されたスキルセクション(ML、データエンジニアリング、本番、可視化)、学位と論文トピックを持つ教育、および重要な場合のみ出版物またはKaggle結果。

Question 2

データサイエンティストCVにすべてのPythonライブラリをリストすべきですか?

Accepted Answer

いいえ。フレームワーク(PyTorch、sklearn、XGBoost、Hugging Face)、本番システムを構築するツール(MLflow、Sagemaker、Ray)、エコシステム(pandas、numpy)をリストします。個々のvizライブラリやマイナーな実験追跡ツールはスキップします。

Question 3

Kaggleコンペティションはデータサイエンティスト履歴書に属しますか?

Accepted Answer

グランドマスターランクは、下部のワンライナーで、はい。終わったチュートリアル数個は、いいえ。データがクリーンすぎ、メトリックが狭すぎるため、採用担当者はKaggleを主要シグナルとして割引します。

Question 4

誇張せずにモデルをどう説明しますか?

Accepted Answer

データセットサイズ、技術、ベースライン、リフトを名指しします。「14M個のラベル付きトランザクションでXGBoost分類器をトレーニングし、同じ偽陽性予算で詐欺リコールを71%から84%に引き上げた」は擁護可能です。「最先端モデルを構築」は違います。

Question 5

データサイエンティスト履歴書にSQLをリストすべきですか?

Accepted Answer

はい、目立つように。ほとんどのデータサイエンスJDはSQLをハード必須スキルとして審査し、応募者の30%は暗黙的と仮定して省略します。省略しないでください。

データサイエンティスト履歴書、モデル面接を獲得するもの。

デプロイ済みは毎回ノートブックに勝つ。