daniel7481의 개발일지

2021.12.02 순위검색(2021 카카오 블라인드 채용) 본문

프로그래머스

2021.12.02 순위검색(2021 카카오 블라인드 채용)

daniel7481 2021. 12. 2. 20:31
반응형

 

[출처: 프로그래머스]

[본 문제는 정확성과 효율성 테스트 각각 점수가 있는 문제입니다.]

카카오는 하반기 경력 개발자 공개채용을 진행 중에 있으며 현재 지원서 접수와 코딩테스트가 종료되었습니다. 이번 채용에서 지원자는 지원서 작성 시 아래와 같이 4가지 항목을 반드시 선택하도록 하였습니다.

  • 코딩테스트 참여 개발언어 항목에 cpp, java, python 중 하나를 선택해야 합니다.
  • 지원 직군 항목에 backend와 frontend 중 하나를 선택해야 합니다.
  • 지원 경력구분 항목에 junior와 senior 중 하나를 선택해야 합니다.
  • 선호하는 소울푸드로 chicken과 pizza 중 하나를 선택해야 합니다.

인재영입팀에 근무하고 있는 니니즈는 코딩테스트 결과를 분석하여 채용에 참여한 개발팀들에 제공하기 위해 지원자들의 지원 조건을 선택하면 해당 조건에 맞는 지원자가 몇 명인 지 쉽게 알 수 있는 도구를 만들고 있습니다.
예를 들어, 개발팀에서 궁금해하는 문의사항은 다음과 같은 형태가 될 수 있습니다.
코딩테스트에 java로 참여했으며, backend 직군을 선택했고, junior 경력이면서, 소울푸드로 pizza를 선택한 사람 중 코딩테스트 점수를 50점 이상 받은 지원자는 몇 명인가?

물론 이 외에도 각 개발팀의 상황에 따라 아래와 같이 다양한 형태의 문의가 있을 수 있습니다.

  • 코딩테스트에 python으로 참여했으며, frontend 직군을 선택했고, senior 경력이면서, 소울푸드로 chicken을 선택한 사람 중 코딩테스트 점수를 100점 이상 받은 사람은 모두 몇 명인가?
  • 코딩테스트에 cpp로 참여했으며, senior 경력이면서, 소울푸드로 pizza를 선택한 사람 중 코딩테스트 점수를 100점 이상 받은 사람은 모두 몇 명인가?
  • backend 직군을 선택했고, senior 경력이면서 코딩테스트 점수를 200점 이상 받은 사람은 모두 몇 명인가?
  • 소울푸드로 chicken을 선택한 사람 중 코딩테스트 점수를 250점 이상 받은 사람은 모두 몇 명인가?
  • 코딩테스트 점수를 150점 이상 받은 사람은 모두 몇 명인가?

즉, 개발팀에서 궁금해하는 내용은 다음과 같은 형태를 갖습니다.

* [조건]을 만족하는 사람 중 코딩테스트 점수를 X점 이상 받은 사람은 모두 몇 명인가?

[문제]

지원자가 지원서에 입력한 4가지의 정보와 획득한 코딩테스트 점수를 하나의 문자열로 구성한 값의 배열 info, 개발팀이 궁금해하는 문의조건이 문자열 형태로 담긴 배열 query가 매개변수로 주어질 때,
각 문의조건에 해당하는 사람들의 숫자를 순서대로 배열에 담아 return 하도록 solution 함수를 완성해 주세요.

[제한사항]

  • info 배열의 크기는 1 이상 50,000 이하입니다.
  • info 배열 각 원소의 값은 지원자가 지원서에 입력한 4가지 값과 코딩테스트 점수를 합친 "개발언어 직군 경력 소울푸드 점수" 형식입니다.
    • 개발언어는 cpp, java, python 중 하나입니다.
    • 직군은 backend, frontend 중 하나입니다.
    • 경력은 junior, senior 중 하나입니다.
    • 소울푸드는 chicken, pizza 중 하나입니다.
    • 점수는 코딩테스트 점수를 의미하며, 1 이상 100,000 이하인 자연수입니다.
    • 각 단어는 공백문자(스페이스 바) 하나로 구분되어 있습니다.
  • query 배열의 크기는 1 이상 100,000 이하입니다.
  • query의 각 문자열은 "[조건] X" 형식입니다.
    • [조건]은 "개발언어 and 직군 and 경력 and 소울푸드" 형식의 문자열입니다.
    • 언어는 cpp, java, python, - 중 하나입니다.
    • 직군은 backend, frontend, - 중 하나입니다.
    • 경력은 junior, senior, - 중 하나입니다.
    • 소울푸드는 chicken, pizza, - 중 하나입니다.
    • '-' 표시는 해당 조건을 고려하지 않겠다는 의미입니다.
    • X는 코딩테스트 점수를 의미하며 조건을 만족하는 사람 중 X점 이상 받은 사람은 모두 몇 명인 지를 의미합니다.
    • 각 단어는 공백문자(스페이스 바) 하나로 구분되어 있습니다.
    • 예를 들면, "cpp and - and senior and pizza 500"은 "cpp로 코딩테스트를 봤으며, 경력은 senior 이면서 소울푸드로 pizza를 선택한 지원자 중 코딩테스트 점수를 500점 이상 받은 사람은 모두 몇 명인가?"를 의미합니다.

역시 기출문제답게 설명이 매우 길다. 처음에 재미삼아 pandas의 dataframe으로 구현해보았다가, 정확도는 다 맞았지만 효율성에서 광탈해서 다른 방법을 찾아야 했다. 더 효율 좋게 풀 수 있는 방법이 존재하겠지만 나는 저 메뉴중에서 가능한 모든 경우의 수(조건의 개수, '-'가 있으면 조건이 하나 줄어드는 것이라고 생각)를 각 딕셔너리에 넣어서 코테 점수를 저장해주는 방법을 선택하였다. 더불어 X점 이상일 때의 경우를 찾아야 했으므로 처음에는 각 query에 대하여 모든 점수를 순회하는 방법을 선택했지만 역시나 시간초과가 나왔고, 조건의 개수에 따라 딕셔너리를 따로 저장했기에 모든 딕셔너리의 value를 sort해주고 난 후 bisect 라이브러리를 이용하여 이분 탐색을 통해 bisect_left를 이용하여 X점 이상이라고 할 때 X점보다 오른쪽에 있는 정수의 개수를 answer 리스트에 넣어서 return 해주었다.

from itertools import combinations
from bisect import bisect_left
language = ['cpp', 'java', 'python']
area = ['backend', 'frontend']
career = ['junior', 'senior']
food = ['chicken', 'pizza']
no_circum = []
len1 = {} #'-'에 따라 조건의 개수가 0~4개가 있으므로 조건이 0개면 no_circum, 아니면 len1~4에다가 저장해주었다
len2 = {}
len3 = {}
len4 = {}
for l in language: #밑에는 나올 수 있는 모든 경우의 수를 딕셔너리에 키로 넣어주었다.
  len1[l] = []
for a in area:
  len1[a] = []
for c in career:
  len1[c] = []
for f in food:
  len1[f] = []
for l in language:
  for a in area:
    len2[(l, a)] = []
  for c in career:
    len2[(l, c)] = []
  for f in food:
    len2[(l, f)] = []
for a in area:
  for c in career:
    len2[(a, c)] = []
  for f in food:
    len2[(a, f)] = []
for c in career:
  for f in food:
    len2[(c, f)] = []
for l in language:
  for a in area:
    for c in career:
      len3[(l, a, c)] = []
    for f in food:
      len3[(l, a, f)] = []
  for c in career:
    for f in food:
      len3[(l, c, f)] = []
for a in area:
  for c in career:
    for f in food:
      len3[(a, c, f)] = []
for l in language:
  for a in area:
    for c in career:
      for f in food:
        len4[(l, a, c, f)] = []
def solution(info, query):
  for i in range(len(info)): 
    info[i] = info[i].split()
  for i in info: # 주어진 info에 대하여 해당하는 조건에 점수를 value값으로 넣어주었다.
    no_circum.append(int(i[-1]))
    for j in range(4):
      len1[i[j]].append(int(i[-1]))
    choose_two = list(combinations(i[:-1], 2))
    for ctwo in choose_two:
      len2[ctwo].append(int(i[-1]))
    choose_three = list(combinations(i[:-1], 3))
    for cthree in choose_three:
      len3[cthree].append(int(i[-1]))
    len4[tuple(i[:4])].append(int(i[-1]))
  no_circum.sort() #이분 탐색을 위하여 각 value 리스트를 정렬해주었다.
  for l1 in len1.keys():
    len1[l1].sort()
  for l2 in len2.keys():
    len2[l2].sort()
  for l3 in len3.keys():
    len3[l3].sort()
  for l4 in len4.keys():
    len4[l4].sort()
  answer = []
  for q in query: #쿼리는 조건이 and를 사이에 두고 주어지므로 and를 기준으로 split해주고, 맨 마지막에는 소울 푸드랑 점수 사이에 and가 없으므로 split해주고 따로 넣어주었다.
    q = q.split(' and ')
    nq = q[-1].split()
    q[-1] = nq[0]
    q.append(nq[1])
    q[-1] = int(q[-1])
    nq = []
    for i in range(5):
      if q[i] != '-':
        nq.append(q[i]) #조건의 개수에 맞는 딕셔너리를 순회, 이분탐색을 이용하여 점수 X이상의 개수를 구했다.
    if len(nq) == 1:
      answer.append(len(no_circum) - bisect_left(no_circum, nq[-1]))
    elif len(nq) == 2:
      answer.append(len(len1[nq[0]]) - bisect_left(len1[nq[0]], nq[-1]))
    elif len(nq) == 3:
      answer.append(len(len2[(nq[0], nq[1])]) - bisect_left(len2[(nq[0], nq[1])], nq[-1]))
    elif len(nq) == 4:
      answer.append(len(len3[(nq[0], nq[1], nq[2])]) - bisect_left(len3[(nq[0], nq[1], nq[2])], nq[-1]))
    else:
      answer.append(len(len4[(nq[0], nq[1], nq[2], nq[3])]) - bisect_left(len4[(nq[0], nq[1], nq[2], nq[3])], q[-1]))
  return answer

느낀 점: 처음에 이분탐색으로 구현했다가 정렬의 시간복잡도가 NlogN이라는 것을 보고 그냥 한번 순회하면 O(N)이니까 더 작지 않나?라고 생각한게 화근이었던 것 같다. 또한 numpy pandas같은 라이브러리는 역시 시간 효율 부분에서는 떨어지는 것 같다. 레벨 1~3정도의 수준이 코테라고 하는데 아직도 갈 길이 먼 것 같다.

반응형