728x90

지난 포스팅에서 technical interview 단계에 대해 간단히 적어보았다.

 

Amazon Interview를 2월 15일 오전에 치뤘는데, 약 5일만에 답변이 왔다. 

 

아래 메일에서 볼 수 있듯이 합격이다!

 

 

Apple은 (사실 현재 4월까지도...) 연락이 없었기도 했고, 인터뷰 프로세스가 굉장히 느린데 (심지어 recruiter도 엄청 느린편이다) 비해 Amazon은 정말 일사천리로 이뤄졌던 것 같다.

 

외국의 한국 기업이라는게 실감이 날 정도였다.

 

감사하게도 이렇게 Amazon Ph.D internship에 합격을 하게 되어 이번 2024 summer 인턴을 5월부터 진행하게 될 기회를 얻었다. 

 

현재는 Amazon으로부터 internship 동안의 re-location 비용을 지원받아서 accommodation을 원격으로 계약한 상황이고, visa confirm을 기다리고 있으며, 이 작업이 끝나면 온라인으로 계좌를 개설할 수 있을 것 같다. 

 

이렇게 또 성장할 기회를 얻은 것 같아 감사하고, 더 많은 것을 큰 곳에서 느낄 수 있음에 하루하루 감사하게 생각하고 살아야겠다.

 

아직 절반도 지나지 않았지만, 2024년은 많은 성장을 할 수 있는 해인 것 같고, 앞으로도 더 그랬음 좋겠다.

 

이렇게 Amazon Ph.D internship apply 관련해서 포스팅을 종료할까 한다.

 

궁금한 사항 관련해서는 댓글로 질문시 최대한 자세히 답변드릴 수 있도록 하겠다!

728x90
728x90

잘 정제된 음성 데이터셋의 경우 (특히 딥러닝 음성인식 및 오디오 처리 학습용의 경우) 거의 Mono channel로 공개가 되어있다.

 

하지만 다양한 실환경에서 녹음된 오디오 데이터셋의 경우, 녹음 기기에 따라 2이상의 channel로 구성된, Stereo channel로 공개가 된 데이터들이 많다.

 

간단하게 아래와 같이 음성을 로드하게 되면

import torchaudio
import torch

waveform = './test.wav'
y, sr = torchaudio.load(waveform)

 

y의 size를 출력해보면, 예를 들어, (2, 100) 과 같이 나올 수가 있다.

 

이를 Stereo channel이라고 한다.

 

간단하게 아래의 그림을 보면 이해가 쉽게 될 것 같은데, stereo는 채널 별 들리는 소리가 약간 다른 반면, mono는 stereo의 평균을 낸 것으로 간주할 수 있다.

https://soundskrit.ca/2023/06/26/stereo-sound-vs-mono-explained/

 

우리가 해결하고자 하는건, 어쨋든 n-channel 이상의 waveform에 대해 평균을 내주어 mono channel로 만드는 것으로 간주할 수 있다. 

 

아래와 같이 해결하면 된다.

 

import torchaudio
import torch

waveform = './test.wav'
y, sr = torchaudio.load(waveform)
waveform_mono = torch.mean(y, dim=0).unsqueeze(0)

 

위와 같이 진행하면 waveform_mono는 (1, 100)의 형태로 얻어질 수 있다.

728x90
728x90

Interview preliminary

 

1차 코테 합격 이후 원하는 날짜로 1:1 research meeting을 잡게 되었는데,

 

내 interviewer는 Research Scientist였고, AWS Seattle에서 근무중인 인도인이었다.

 

면접 전부터, 평소에 인도 영어가 어려운 것을 잘 알고 있어서 걱정이 많이 되었다.

 

Apple과 마찬가지로, 나의 research works에 대한 presentation을 30분 정도의 분량으로 준비하였다.

 

사실 Amazon 관련해서는 크게 면접을 준비하지 못하였다.

 

당시에만 하더라도 나는 Apple을 나름 잘 봤다고 생각했고, 높은 확률로 인턴이 될 것이라고 생각했기 때문에

 

또 일이 굉장히 바쁜 시기라서, 면접 전날 간단하게 DL/ML 관련 개념만 익혔고, 

 

Amazon Principle Leadership (LP) 관련 주제가 무엇이 있는지 정도만 체크하였다.

 

관련해서, 다른 빅테크와는 달리 Amazon은 LP 관련하여 항상 면접에 나온다고 들었는데, 

 

가장 많이 물어보는 문제는 "Tell me about a time when you took on something significant outside your area of responsibility" 혹은 "Tell me about the time that you solve a complex problem with a simple solution" 와 같은 문제들이다. 

 

사실 LP 관련 문제가 가장 난해했는데, 일단 영어를 잘 들어야하고 (이건 그냥 당연한거다) 빠른 시간내에 어떻게 썰을 잘 풀지 고민해야하고, 사실에 근거해서 얘기를 해야 거짓말 티가 안나기 때문에, 

 

Interviewer로부터 주어진 문제에 대해 나의 스토리를 잘 풀어서 설명하는 스킬이 중요한 것 같다. 

 

Amazon은 특히 STAR 형식으로 답변을 하는게 좋다고 하는데, Situation, Task, Action, Result, 즉 주어진 상황과 목표, 내가 취했던 행동들, 그리고 결과에 대한 순서로 질문에 답을 해야한다.

 

DL/ML 관련 문제야 늘 해왔던 것들이니까 큰 어려움이 없었는데, LP가 나는 더 어려웠던 것 같았다.

 

Interview 당일

 

예상했던 Interviewer와 약 1시간의 interview가 진행되었다.

 

순서는 간단한 자기 소개 -> ML/DL -> DL 기반 내 분야 (전반적인 음성처리) -> LP 순서로 진행했다.

 

전부 다 공유할 순 없지만, 질문 몇 개만 쓰자면

-  Ph.D 진행하면서 주로 연구했던것들에 대해 간략하게 설명해봐라 -> 논문 위주로 PPT로 보여주려 했는데 컷당하고 그냥 말로 설명하라고 하였음

- 이전에 제출했던 CV에 있는 모든 논문 내용들에 대해 세밀하게 물어보는 형식이었음

- 예를 들어 Diffusion 내용이 들어가면 이에 대한 세부적인 질문, TTS의 경우 Tacotron 1, 2에 대한 model process, mel-spectrogram의 feature extraction 전반적인 단계 등등.. 

 

LP 관련 질문은

- 학회 제출 혹은 프로젝트 마무리와 같은 데드라인을 아주 조금 남겨둔 상황인데 어떻게 해결해 나갈 것인가?
- 공동체 생활에서 생각지도 못한 문제가 주어졌을때 어떻게 해결했나? 해결했다면, 희생했나? 희생했다면, 어떤것을 하였고 무엇을 배웠는가?

 

특히 LP 관련되서 질문이 굉장히 어려웠다. 

 

예정된 60분보다 20분 더 추가되서 inteview가 진행되었고 (ML/DL 55분) (LP 15분), 답변은 괜찮게 다 했던 것 같았다.

 

마지막으로 내게 질문해보라해서 해당 팀에 대한 나의 role, 그리고 팀 소개 등에 대해 물어봤고 자세히 설명을 들을 수 있었다.

 

728x90

+ Recent posts