モデル、データセット、メトリック、ビジネス成果を示します。ATSクリーン、採用担当者がスキャン可能、PyTorch、SQL、本番環境にデプロイされたモデルを審査する採用ファネル向けに構築されています。
採用担当者は8秒のCVスキャンで真剣なデータサイエンティストとKaggleの趣味家を区別できません。彼らを助けてください:デプロイメントコンテキスト(gRPCサービスの背後にあるリアルタイム推論、Airflowでのバッチスコアリング)、トレーニングデータのスケール、モデルが動かしたビジネスメトリックを名指しします。
スキルは4つのグループに分割すべき:ML/DLスタック(PyTorch、sklearn、XGBoost)、データエンジニアリング(SQL、Spark、dbt、Snowflake)、本番(FastAPI、MLflow、Sagemaker)、可視化(Tableau、Looker、matplotlib)。すべてを1つのブロックに投げ込まないでください。
出版物とKaggleランクは下部に各1行の価値があり、決してリードではない。リードはデプロイされた作業です。
助ける:キャリア初期または研究からの移行の場合。データセット、技術、結果を持つ3つのデプロイされたモデルとともに、クリーンなプロジェクトブロックは、まばらな職歴を上回ります。
害する:業界で5年以上の場合。プロジェクトセクションは、ページを埋めるのに十分な仕事経験がないことを暗示します。これはあなたが望むこととは逆です。
プロジェクトを含める場合、それぞれを仕事のように扱います:会社相当の行、日付、2-3個の定量化された箇条書き。
デプロイされたモデル結果を持つ逆時系列の職歴、グループ化されたスキルセクション(ML、データエンジニアリング、本番、可視化)、学位と論文トピックを持つ教育、および重要な場合のみ出版物またはKaggle結果。
いいえ。フレームワーク(PyTorch、sklearn、XGBoost、Hugging Face)、本番システムを構築するツール(MLflow、Sagemaker、Ray)、エコシステム(pandas、numpy)をリストします。個々のvizライブラリやマイナーな実験追跡ツールはスキップします。
グランドマスターランクは、下部のワンライナーで、はい。終わったチュートリアル数個は、いいえ。データがクリーンすぎ、メトリックが狭すぎるため、採用担当者はKaggleを主要シグナルとして割引します。
データセットサイズ、技術、ベースライン、リフトを名指しします。「14M個のラベル付きトランザクションでXGBoost分類器をトレーニングし、同じ偽陽性予算で詐欺リコールを71%から84%に引き上げた」は擁護可能です。「最先端モデルを構築」は違います。
はい、目立つように。ほとんどのデータサイエンスJDはSQLをハード必須スキルとして審査し、応募者の30%は暗黙的と仮定して省略します。省略しないでください。