본문 바로가기

두두의 알고리즘/문제

[동적계획법] 난이도1.5, Goldman Sachs 인터뷰 '편집 거리' (Python)

728x90

<문제>

두 개의 문자열 A와 B가 주어졌을 때 문자열 A를 편집하여 문자열 B를 만들고자 합니다. 문자열 A를 편집할 때는 다음의 세 연산 중에서 한 번에 하나씩 선택하여 이용할 수 있습니다.
1. 삽입 (Insert) : 특정한 위치에 하나의 문자를 삽입합니다.
2. 삭제 (Remove) : 특정한 위치에 있는 하나의 문자를 삭제합니다.
3. 교체 (Replace) : 특정한 위치에 있는 하나의 문자를 다른 문자로 교체합니다.

이때 편집 거리란 문자열 A를 편집하여 문자열 B로 만들기 위해 사용한 연산의 수를 의미합니다. 문자열 A를 문자열 B로 만드는 최소 편집 거리를 계산하는 프로그램을 작성하세요. 예를 들어 "sunday"와 "saturday"의 최소 편집 거리는 3입니다.

<입력 조건>

  • 두 문자열 A와 B가 한 줄에 하나씩 주어집니다.
  • 각 문자열은 영문 알파벳으로만 구성되어 있으며, 각 문자열의 길이는 1보다 크거나 같고, 5,000보다 작거나 같습니다.

<출력 조건>

  • 최소 편집 거리를 출력합니다.

<문제 풀이>

1. 2개의 문자열을 2차원 배열로 만든 후 각 행렬에 글자수만큼 i를 넣는다. (빈 문자열을 'sat'문자열로 바꾸기 위해서는 3번의 수정이 필요하기 때문)

2. 만약 문자열이 같다면 왼쪽 위 값을 추가

3. 만약 다르다면, 왼쪽, 왼쪽 위, 위 값 중 가장 작은 값 + 1을 추가 (삭제, 수정, 교체가 있으므로)

 

<코드>

def edit_dist(str1, str2):
	n = len(str1)
    m = len(str2)
    
    dp = [[0]*(m+1) for _ in range(n+1)]
    
    for i in range(1,n+1):
    	dp[i][0] = i
    for j in range(1,m+1):
    	dp[0][j] = j
        
    for i in range(1,n+1):
    	for j in range(1,m+1):
        	if str1[i-1] == str2[j-1]:
            	dp[i][j] = dp[i-1][j-1]
            else:
            	dp[i][j] = 1 + min(dp[i][j-1], dp[i-1][j], dp[i-1][j-1])
	return dp[n][m]
    
str1 = input()
str2 = input()

print(edit_dist(str1, str2))

 

<고쳐야 할 점>

  • 풀이방법 외우기
  • 복습 알고리즘