본문 바로가기
Algorithm/Basic

[최단 경로 알고리즘 - 1] 다익스트라 알고리즘

by 원만사 2021. 10. 31.
반응형

* 최단 경로 알고리즘이란?

 최단 경로 알고리즘이란 가장 짧은 경로를 찾는 알고리즘이다. 최단 경로를 찾는 경우에는 다양한 종류가 있는데, 각 종류 별로 효율적인 알고리즘이 존재한다.

 '한 지점에서 다른 특정 지점까지의 최단 경로를 구해야 하는 경우', '모든 지점에서 다른 모든 지점까지의 최단 경로를 모두 구해야 하는 경우' 등의 사례가 존재한다. 

 최단 경로 문제는 보통 그래프를 이용해서 표현하며 각 지점은 그래프에서 '노드'로 표현하고, 지점간 연결된 도로는 그래프에서 '간선'으로 표현된다.

 최단 경로 알고리즘에는 다익스트라, 플로이드 워셜, 벨만 포드 알고리즘이 존재한다. 이 중 다익스트라에 대해서 먼저 알아보자.

 

 

* 다익스트라(Dijkstra) 알고리즘

 다익스트라 최단 경로 알고리즘은 그래프에서 여러 개의 노드가 있을 때, 특정한 노드에서 출발하여 다른 노드로 가는 각각의 최단 경로를 구해주는 알고리즘이다. 다익스트라 알고리즘은 '음의 간선(0보다 작은 값을 가지는 간선)'이 없을 때 정상적으로 동작한다. 알고리즘의 원리는 다음과 같다.

  1. 출발 노드를 설정한다.
  2. 최단 거리 테이블을 초기화한다.
  3. 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택한다.
  4. 해당 노드를 거쳐 다른 노드로 가는 비용을 계산하여 최단 거리 테이블을 갱신한다.
  5. 위 과정에서 3번과 4번을 반복한다.

 다익스트라는 최단 경로를 구하는 과정에서 '각 노드에 대한 현재까지의 최단 거리' 정보를 항상 1차원 리스트에 저장하며 리스트를 계속 갱신한다. 매번 현재 처리하고 있는 노드를 기준으로 주변 간선을 확인한다. 

 

* 우선순위 큐(힙구조)를 이용한 다익스트라 알고리즘

 위의 그래프에서 5번 노드에서 출발하여 다른 노드로 가는 각각의 최단 경로를 구하는 과정을 살펴보자. 먼저 모든 정점들을 힙(우선순위 큐)에 넣는다.

<dist 배열>

 

 위 표에서 i는 정점 인덱스, d는 최단 거리이고 p는 이전 정점이다. d를 기준으로 최소 힙으로 구성한다. 

 이제 힙에서 가장 위에 있는 노드를 꺼낸다. 힙에서 노드를 꺼낸 뒤에 해당 노드를 이미 처리한 적이 있다면 무시하면 되고, 아직 처리하지 않는 노드에 대해서만 처리하면 된다.

 위의 힙에서는 (5,0)이 꺼내지게 되고 5와 연결되어 있는 2번, 4번 노드로 가는 최소 비용을 계산한다. 각각 4(0 + 4), 2(0 + 2)가 되는데 현재 dist 배열에서 dist[2]와 dist[4]가 무한대로 설정되어 있으므로, 더 짧은 경로를 찾게 된 것이다. 그러므로 dist 배열을 갱신해주면 된다. 이렇게 더 짧은 경로를 찾은 노드 정보들을 다시 우선순위 큐에 넣는다. 

 

<dist 배열>

 다시 우선순위 큐에서 원소를 꺼내서 동일한 과정을 반복한다. 이번에는 (4, 2)가 꺼내지게 되고 dist[4]와 d의 값을 비교하여 dist[4]가 더 작으면 연산하지 않고, 같거나 크면 연산한다.

 4에서 갈 수 있는 2번, 3번 노드로 가는 최소 비용을 구한다. 각각 3(2 + 1), 3(2 + 1)이 되는데 현재 dist 배열의 값과 비교했을 때 모두 작으므로 dist 배열 값을 갱신해주고 우선순위 큐에 넣어준다. 

<dist 배열>

 

 다시 원소를 꺼내서 반복한다. (2, 3) 원소가 꺼내지고, dist[2]와 d가 3으로 같으므로 2 주변의 정점을 계산해서 기존의 dist[i]보다 더 작아지는 정점들을 큐에 넣는다. 2번에서 갈 수 있는 노드는 1번 노드가 있고 거리는 6(3 + 3)이 된다. dist[1]보다 작으므로 dist[1]을 갱신해주고 우선순위 큐에 넣는다.

<dist 배열>

 

 다시 원소를 꺼낸다. (3, 3)이 꺼내지고 dist[3]과 d가 3으로 같으므로 3에서 갈 수 있는 노드의 거리를 계산한다. 4번 노드로 가는 거리를 계산하면 5(3 + 2)가 되고 이는 dist[4]보다 크다. 그러므로 이는 큐에 넣지 않는다.

<dist 배열>

 다시 원소를 꺼낸다. (2, 4)가 꺼내지는데 dist[2]가 3으로 d보다 작으므로 연산하지 않는다.

 

<dist 배열>

 

 다시 원소를 꺼낸다. (1, 6)이 꺼내지는데 dist[1]과 d가 6으로 같으므로 연산한다. 1번에서 갈 수 있는 노드는 4번 노드이고 거리를 계산하면 9(6 + 3)이 된다. 이는 dist[4]보다 크므로 dist[4]를 갱신하지 않고 우선순위 큐에 넣지 않는다.

 

<dist 배열>

 이제 우선순위 큐가 비었으므로 연산이 중지된다. 연산이 끝난 후 얻은 dist 배열이 5번 노드에서 각 노드로 가는 최단 거리가 된다.

 

* 파이썬으로 구현한 다익스트라 알고리즘

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
import heapq
import sys
input = sys.stdin.readline
INF = int(1e9# 무한을 의미하는 값으로 10억을 설정
 
# 노드의 개수, 간선의 개수 입력
n, m = map(int, input().split())
 
# 시작 노드 번호 입력
start = int(input())
 
# 각 노드에 연결되어 있는 노드에 대한 정보를 담는 리스트 만들기
graph = [[] for i in range(n + 1)]
 
# 최단 거리 테이블을 모두 무한으로 초기화
distance = [INF] * (n+1)
 
# 모든 간선 정보 입력 받기
for _ in range(m):
    a, b, c = map(int, input().split())
    # a번 노드에서 b번 노드로 가는 비용이 c라는 의미
    graph[a].append((b, c))
 
def dijkstra(start):
    q = []
 
    # 시작 노드로 가기 위한 최단 경로는 0으로 설정하여 큐에 삽입
    heapq.heappush(q, (0, start))
 
    distance[start] = 0
 
    while q: # 큐가 비어있지 않다면
        # 가장 최단 거리가 짧은 노드에 대한 정보 꺼내기
        dist, now = heapq.heappop(q)
 
        # 현재 노드가 이미 처리된 적이 있는 노드라면 무시
        if distance[now] < dist:
            continue
 
        # 현재 노드와 연결된 다른 인접한 노드들을 확인
        for (node, nodeDist) in graph[now]:
            cost = dist + nodeDist
 
            # 현재 노드를 거쳐서, 다른 노드로 이동하는 거리가 더 짧은 경우
            if cost < distance[node]:
                distance[node] = cost
                heapq.heappush(q, (cost, node))
 
# 다익스트라 알고리즘 수행
dijkstra(start)
 
# 모든 노드로 가기 위한 최단 거리를 출력
for i in range(1, n+1):
    # 도달할 수 없는 경우, 무한(INFINITY)이라고 출력
    if distance[i] == INF:
        print('INFINITY')
    # 도달할 수 있는 경우 거리를 출력
    else:
        print(distance[i])
 
cs

 

* 참고

https://hsp1116.tistory.com/42

 

 

반응형

댓글