Google Data Science Interviewspørgsmål: Alt hvad du behøver at vide for at knække det



Denne artikel giver dig en masse Google Data Science Interview Questiosn, Interviewprocessen og forudsætningerne for at ansøge om et job hos Google.

At blive ansat i et globalt anerkendt firma som Google er et drømmejob for mange mennesker. De har nogle af de mest talentfulde AI-forskere, og i verden. Der er ikke mange kilder til Google Interviewspørgsmål online, og det er ikke let at få et job der. Så jeg vil dække følgende emner i denne artikel:

Jobbeskrivelse og krav

Med en gennemsnitlig løn på $ 169.067 , inklusive bonus. En Google Data Scientists løn spænder fra $ 120.000 - $ 280.000 . Med denne høje løn skal du kende de rigtige krav til det job, du ansøger. Selvom kravene varierer fra position til position, nedenfor er nogle af de almindelige:

Minimumskrav:





hvad er tostring-metoden i java

google

  • Kandidatgrad i kvantitativ disciplin (statistik, operationsforskning, datalogi)
  • 2 års erhvervserfaring inden for dataanalyserelateret felt
  • Erfaring med statistisk software (f.eks. R , , MATLAB, Pandas) og
  • Erfaring med databasesprog (f.eks. SQL )

Ansvar:



hvordan man bruger splitmetoden i java
  • Arbejd med store, komplekse datasæt. Løs vanskelige, ikke-rutinemæssige analyseproblemer ved at anvende avancerede analysemetoder efter behov
  • Udfør analyser, der inkluderer dataindsamling og kravspecifikation, behandling, analyse, løbende leverancer og præsentationer
  • Byg og prototype analyserørledninger iterativt for at give indsigt i skala
  • Udvikle omfattende viden om Googles datastrukturer og metrics, og fortaler for ændringer, hvor det er nødvendigt for produktudvikling
  • Interagere tværfunktionelt ved at komme med forretningsanbefalinger (f.eks. Cost-benefit, prognoser, eksperimentanalyse)
  • Forskning og udvikling af analyse-, prognosemetoder og optimeringsmetoder for at forbedre kvaliteten af ​​Googles brugervenlige produkter

Google Data Science Interviewproces

Rydning af listen er i sig selv en hård opgave, som helt afhænger af din CV, følgebrev og Erfaring . Google Datalogi Interviewspørgsmål er en blanding af Brain teasers og tekniske forespørgsler. Normalt er den første proces telefonisk interview.

Telefonisk interview:

Den består af spørgsmål, der hovedsagelig er baseret på (konkret og teoretisk) og stærkt baseret på . Spørgsmålene varierer også afhængigt af de projekter, du har arbejdet med.
  • Sag 1: Interviewene havde spurgt om funktionsextraktionsteknikker, PCA (brugt i projekter), korrelationsanalyse, nogle klassificeringsteknikker, der blev brugt (SVM, GBM, neuralt net). Hvorfor ikke logistisk regression, hvorfor GBM? - Dybest set spørgsmål, der drejer sig om klasseseparation.
  • Sag 2: Hvorfor bruge funktionsvalg? Hvis to forudsigere er stærkt korrelerede, hvad er virkningen på koefficienterne i den logistiske regression? Hvad er koefficienternes konfidensintervaller?
  • Sag 3: En disk drejer på en spindel, og du ved ikke i hvilken retning disken drejer. Du får et sæt stifter. Hvordan vil du bruge stifterne til at beskrive, på hvilken måde disken drejer?
Efter de telefoniske interviews er det ansigt til ansigt og kodningsrunder. Så lad os diskutere nogle af de mest almindelige spørgsmål til Google Data Science Interview. Selvom disse spørgsmål muligvis ikke stilles nøjagtigt som angivet nedenfor, har jeg forsøgt at dække mange af dem.

Google Data Science Interviewspørgsmål

Disse spørgsmål er ikke forvirrende, da Google i stedet er stoppet med at stille disse spørgsmål, de har lignende spørgsmål, som de kalder Problemløsende spørgsmål . Der stilles mange maskinlæringsspørgsmål, hele vejen fra generiske til de praktiske. Google dybest set dækker bredden af ​​emner snarere end dybde. Q1. Du er i et kasino og har to terninger at lege med. Du vinder $ 10 hver gang du kaster 5. Hvis du spiller indtil du vinder og derefter stopper, hvad er den forventede udbetaling? Q2. Du er ved at gå på et fly til London, du vil vide, om du skal medbringe en paraply eller ej. Du ringer til tre af dine tilfældige venner og som hver enkelt af dem, hvis det regner. Sandsynligheden for, at din ven fortæller sandheden, er 2/3, og sandsynligheden for, at de spiller et prank på dig ved at lyve, er 1/3. Hvis alle tre af dem fortæller, at det regner, hvad er sandsynligheden for, at det faktisk regner i London. Q3. Hvordan vil tilføje nyt Facebook medlemmer til databasen over medlemmer, og kode deres forhold til andre i databasen? Q4. Hvordan vil du teste, at der er en øget sandsynlighed for, at en bruger forbliver aktiv efter 6 måneder, da en bruger har flere venner nu? Q5. Du får 40 kort med fire forskellige farver - 10 grønne kort, 10 røde kort, 10 blå kort og 10 gule kort. Kortene i hver farve er nummereret fra en til ti. To kort vælges tilfældigt. Find ud af sandsynligheden for, at de valgte kort ikke har samme antal og samme farve. Q6. Opret et program på et sprog efter eget valg for at læse en tekstfil med forskellige tweets. Outputtet skal være 2 tekstfiler - en der indeholder listen over alle unikke ord blandt alle tweets sammen med optællingen for gentagne ord, og den anden fil skal indeholde det gennemsnitlige antal unikke ord for alle tweets. Q7. Hvad vil du gøre, hvis fjernelse af manglende værdier fra et datasæt forårsager bias? Q8. En disk drejer på en spindel, og du ved ikke i hvilken retning disken drejer. Du får et sæt stifter. Hvordan vil du bruge stifterne til at beskrive, på hvilken måde disken drejer? Q9. Hvordan designer du en anbefalingsmotor til job? Q10. Hvilken type produkt vil du bygge hos Google? Q11. Biler er implanteret med speed tracker, så forsikringsselskaberne kan spore om vores kørselstilstand. Baseret på denne nye ordning, hvilken slags forretningsspørgsmål kan besvares? Q12. Hvordan kan du beslutte, om den ene algoritme er bedre end den anden? Q13. En kasse har 12 røde kort og 12 sorte kort. En anden kasse har 24 røde kort og 24 sorte kort. Du vil trække to kort tilfældigt fra et af de to felter, hvilket felt har større sandsynlighed for at få kort i samme farve, og hvorfor? Q14. Hvad er forskellen mellem en poset model og en boostet model? Q15. Du opretter en rapport for uploads af brugerindhold hver måned og observerer en pludselig stigning i antallet af upload for januar måned. Stigningen i uploads er især i image uploads. Hvad tror du vil være årsagen til dette, og hvordan vil du teste denne pludselige stigning? Q16. Du ejer en tøjvirksomhed og vil forbedre din plads på markedet. Hvordan vil du gøre det fra jordoverfladen? Q17. Hvordan beslutter du, hvilke versioner af de to af Surge Pricing Algorithms, der fungerer bedre for ethvert luftfartsselskab? Q18. Hvad er graden af ​​frihed for lasso? Q19. Hvad er forskellen mellem en iterator, generator og listeforståelse i Python? Q20. I betragtning af et sæt websider og ændringer på webstedet, hvordan vil du teste den nye webstedsfunktion for at afgøre, om ændringen fungerer positivt? Q21. Givet en MxN-dimensionmatrix med hver celle, der indeholder et alfabet, skal du finde ud af, om en streng er indeholdt i den eller ej. Q22. Hvordan skal du opbygge et cachesystem ved hjælp af en avanceret datastruktur som hashmap? Q23. Hvis du kunne få datasættet om ethvert emne af interesse, uanset indsamlingsmetoder eller ressourcer, hvordan ville datasættet se ud, og hvad vil du gøre med det? Q24. Hvad er anomaliedetekteringsmetoder? Q25. Hvordan fungerer caching, og hvordan bruger du det i datalogi? Så fyre, med dette slutter vi denne artikel. Google Data Science Interviewspørgsmål er for det meste scenariebaseret og kræver, at du har Problemløsende evner og desuden skal du vide, hvordan du anvender datalogi til disse situationer. Jeg håber, at dette vil give dig et perspektiv til at være forberedt på ethvert datalogi-interview i fremtiden. Det være sig Google, Microsoft, Apple eller Uber. Alle de tekniske giganter stiller lignende typer spørgsmål, når det kommer til datavidenskab, da det er et stort og samtidig et nyt felt. gør dig dygtig i de værktøjer og systemer, der bruges af Data Science Professionals. Det inkluderer træning i statistik, datalogi, Python, Apache Spark & ​​Scala, Tensorflow og Tableau. Læreplanen er bestemt af omfattende forskning i mere end 5000 jobbeskrivelser over hele kloden. Hvis du har spørgsmål, er du velkommen til at nævne i kommentarfeltet nedenfor.