Применяем на практике знания, полученные на курсе MIT 6.00x (edx.org)

2013-01-18 в 10:08, admin, рубрики: EdX, python, Алгоритмы, алгоритмы поиска, игры для iphone, Учебный процесс в IT, метки: EdX, python, алгоритмы поиска, игры для iphone

В комментариях к моему посту про курс 6.002x MITx мне задавали вопрос — пригодилось ли изученное в жизни. И я отвечал — да, конечно, вот тут утром пока зубы чистил, RC-константу посчитал… Но пруфов не было. С тех пор я закончил еще два курса — UC Berkeley CS188.1x Introduction to Artificial Intelligence (открыта регистрация на 18 февраля) и MITx: 6.00x Introduction to Computer Science and Programming. И если после CS188.1x я просто был полон эмоций и не знал, куда бы приткнуть свежеполученные знания (кроме как решить задачу о ходе коня), то после прохождения 6.00x подвернулся случай блеснуть.

Дело в том, что я скачал в аппсторе набор головоломок Игры разума. И безнадежно застрял на уровне «Китайские шашки». Можно было найти прохождение в интернете, но это больше не наш метод. Теперь мы сами с усами. Мир никогда больше не будет прежним.

Китайские шашки

Есть поле, на поле стоят фишки. Одна из клеток — пустая. Мы можем перемещаться только съедая шашку на соседней клетке, перепрыгивая через нее. По диагонали кушать шашки нельзя. Исходное состояние:

    o o o     
    o o o     
o o o o o o o 
o o o . o o o 
o o o o o o o 
    o o o     
    o o o

Следующий ход возможен, например, такой:

    o o o     
    o o o     
o o o o o o o 
o . . o o o o 
o o o o o o o 
    o o o     
    o o o

Вот такая простенькая задача. Хе-хе, было подумал я, минуты три на решение. Через несколько дней я крепко чесал в затылке и пытался родить какую-нибудь действующую тактику. Задача, ****, не решалась. Придется применять питон.

Из курсов я вынес, что во всех поисковых задачах нужно решить всего три подзадачи (господи, кому я это рассказываю — это ж, наверное, азы):

Закодировать состояние системы
Проверить, является ли определенное состояние решением
Сгенерировать следующие состояния

Что-то бился я, бился с кодированием состояния, и в итоге остановился на простой строке в 49 символов длинной:

initState = '  ooo  '+'  ooo  '+'ooooooo'+'o..oooo'+'ooooooo'+'  ooo  '+'  ooo  '

Это сильно облегчает решение первого пункта, но грозит проблемами третьем. Ну и ладно. В общем, как нас и учили, пишем класс Problem:

class Problem(object):
    def __init__(self, initState):
        self.initState = initState

    def isGoal(self, state):
        if state.count('o') > 1:
            return False
        else: return True

    def generateSuccessors(self, state):
        res = []
        idx = 0
        for c in state:
            if c == '.':
                ##we can move here
                res += self.getValidMoves(state, idx)
            idx += 1
        return res

    def getValidMoves(self, state, idx):
        res = []
        ## get North:
        if idx in [16,17,18,23,24,25,28,29,30,31,32,33,34,37,38,39,44,45]:
            sN = state[:]
            if sN[idx-7] == 'o':
                if sN[idx-14] =='o':
                    sN = sN[0:idx-14]+'.'+sN[idx-13:idx-7]+'.'+sN[idx-6:idx]+'o'+sN[idx+1:]
                    res.append(sN)

        ## get South:
        if idx in [2,3,4,9,10,11,14,15,16,17,18,19,20,23,24,25,30,31,32]:
            sS = state[:]
            if sS[idx+7] == 'o':
                if sS[idx+14] =='o':
                    sS = sS[0:idx]+'o'+sS[idx+1:idx+7]+'.'+sS[idx+8:idx+14]+'.'+sS[idx+15:]
                    res.append(sS)

        ## get West:
        if idx in [4,11,16,17,18,19,20,23,24,25,26,27,30,31,32,33,34,39,46]:
            sW = state[:]
            if sW[idx-1] == 'o':
                if sW[idx-2] =='o':
                    sW = sW[0:idx-2]+'..o'+sW[idx+1:]
                    res.append(sW)
        
        ## get East:
        if idx in [2,9,14,15,16,17,18,21,22,23,24,25,28,29,30,31,32,37,44]:
            sE = state[:]
            if sE[idx+1] == 'o':
                if sE[idx+2] =='o':
                    sE = sE[:idx]+'o..'+sE[idx+3:]
                    res.append(sE)

        return res

    def printState(self, state):
        res = ''
        for x in range(7):
            for y in range(7):
                res += state[x*7+y]+' '
            res+='rn'
        print res

Фактически здесь мы определяем начальное значение системы при инициализации проблемы и определяем методы для решения пп 2 и 3. На наше счастье, проверить любое состояние на то, является ли оно решением, предельно просто — считаем, сколько фишек осталось на доске — если больше одной, то надо еще поработать.
А вот с генерацией валидных следующих ходов я немножко помучился, так как строка одномерна, а доска двумерна. И надо это как-то приводить друг к другу. Возможно, даже скорее всего, я набыдлокодил, но в свое оправдание хочу сказать, что я, кажется, смог применить принцип KISS, про который так много читал на хабре. А поэтому идем по доске, на каждой пустой клеточке смотрим по всем направлениям — есть ли две фишки в том направлении. Если да — то заменяем те фишки пустыми местами, а само пустое место — фишкой. И отдаем, как следующий ход.
Несколько наблюдений:

В этой задаче решение находится всегда на дне графа. А значит breadth-first search всегда будет максимально долгим.
В этой задаче невозможно прийти в одно из предыдущих состояний. Соответственно можно не париться проверкой на закольцовку графа (см.дальше, все на самом деле интереснее), но просто меня так учили и я это сделал
К этой задаче не придумывается эвристика. По крайней мере она не придумывается просто. Любой ход приводит к уменьшению количества фишек на 1. Значит можно только по взаимному положению фишек оценить «хорошесть» или «плохость» состояния. А это нетривиально

Поэтому алгоритм будет простенький:

def dfs(p):
    fringe = [[p.initState]]
    tried = set()
    
    while fringe:    
        cur = fringe.pop()           
        tried.add(cur[-1])

        for lm in p.generateSuccessors(cur[-1]):
            if p.isGoal(lm):
                return cur+[lm]
            else:
                if lm not in tried:
                    fringe.append(cur+[lm])
    return None

Здесь p — это объект класса Problem

p = Problem(initState)

Все готово, запускаем и уходим пить чай. Лет на 12-ть, так как копму предстоит перебрать в самом худшем случае 2^32 комбинаций. Тут я схитрил и сразу же уменьшил количество комбинаций вдвое, сделав первый ход за компьютер и задав начальным состоянием положение фишек уже после первого хода. Дальше я заметил, что доска — центрально симметричная, а значит всегда будет четыре дублирующихся состояния с учетом поворота доски на 90, 180 и 270 градусов. Чуть усложним проверку на расрытые ноды графа:

def rotateField(field):
    res = ''
    for i in range(7):
        for j in range(7):
            res += field[7*j+i]
    return res

…

if lm not in tried:
lmr = rotateField(lm)
    if lmr not in tried:
        if rotateField(lmr) not in tried:
            if rotateField(lm) not in tried:
                fringe.append(cur+[lm])

Ну и все-таки несколько веток я отрезал, включив проверку на состояние, когда на доске есть фишки, но они гарантированно далеко друг от друга и не смогут друг друга сожрать:

    o o o     
    o o o     
. . . . . . .  
. . . . . . . 
. . . . . . . 
    o o o     
    o o o

def checkDeadCombinations(state):
    ''' False = dead
        True - combination is OK'''
    
    if '.'*21 in state:
        if '.' in state[:14] and '.' in state[-15:]:
            return False
    if '.'*21 in rotateField(state):
        if '.' in state[:14] and '.' in state[-15:]:
            return False

Ну вот, теперь есть надежда, что я доживу до того момента, как комп решит за меня эту задачку :-)

Домино

Предыдущую задачку решил, чем привел жену в восхищение, и тут же уткнулся в следующую. Дана коробка костяшек домино (28 штук, стандартная). Надо выбрать 8 костяшек и сложить их в квадрат 4х4, так что получается два вертикально стоящих ряда по четыре костяшки в каждом.

HHHH
HHHH

Суммы по строкам, столбцам и диагоналям должны быть равны шести:
Здесь можно применить поиск решения задачи с ограничениями, но, поняв принцип, я так и не научился реализовывать его в коде. Поэтому будем тупо брутфорсить.
Генерим костяшки:

dices = []
for i in range(7):
    for j in range(i,7):
        dices.append((i,j))

В итоге имеем лист пар типа (0,0), (1,0) и т.д. для каждой косточки домино.
Поскольку сумма в каждой строке равна шести, строк четыре, то нам нужны все комбинации фишек, дающих в сумме 24. Посидел я, поскрипел мозгами на тему того, как составить все эти комбинации, потом вспомнил, что python comes with batteries included и просто нажал на кнопку включения:

def iterWorkingSets(dices):
    for cmb in itertools.combinations(dices, 8):
        ds = 0
        for dice in cmb:
            ds += dice[0]
            ds += dice[1]
        if ds == 24:
            yield cmb

В итоге мы отсеяли все комбинации костяшек, которые гарантированно решения не дадут. Дальше я просто перебрал все комбинации и для каждой комбинации попереставлял костяшки, проверяя, нет ли решения:

def checkArr(arr):
    diag = 0
    idx = 0
    ##print arr
    for row in arr:
        diag += row[idx]
        idx += 1
        if sum(row) != 6:
            #print 'row', idx, 'is not 6'
            return False
    if diag !=6:
        #print 'diag 1 is not 6'
        return False
    diag = 0
    idx = 3
    arr = arr.transpose()
    for row in arr:
        diag += row[idx]
        idx -= 1
        if sum(row) != 6:
            #print 'column', idx, 'is not 6'
            return False
    if diag != 6:
        #print 'diag 2 is not 6'
        return False
    return True

Решения не было. Я запустил еще раз. Решения не было опять. Если бы я курил, я бы пошел покурить. Что-то тут не то, подумал я. Брутфорсер так просто не заборешь, решение быть должно, а значит ошибка в брутфорсере. И стал искать ошибку. Ошибка не находилась. Выпив энное количество кофе, я пошел поиграть в саму игру, чтобы понять — что же я делаю не так. Запустил игру, покидал костяшек на поле и стал их двигать и перевора… ПЕРЕВОРАЧИВАТЬ! Брутфорсер не переворачивал костяшки!
Ой, а как же это, блин, написать? Опять itertools, генерим суперсет для range(6), потом для каждой комбинации прогоняем ее через суперсет, перевертывая костяшки. Ой, мама.

### Я бы никогда не смог так написать
allsubsets = lambda n: list(itertools.chain(*[itertools.combinations(range(n), ni) for ni in range(n+1)]))

for wc in iterWorkingSets(dices):
    wc = list(wc)
    print 'I here loop through all set of dices that produce 24'
    print 'This is comb #', cmbNum, ':'
    print wc
    cmbNum += 1

    
    for turn in allsubsets(6):
        tc = wc[:]
        for k in range(6):
            if k in turn:
                tc[k] = wc[k][::-1]
            else:
                tc[k] = wc[k]

        #print 'This is subcom of comb #', cmbNum, ':'
        #print tc
            

    
        for c in itertools.permutations(tc):
            ''' I here loop through all re-combinations of the same set'''
            allNum = []
            for a in c:
                allNum+=list(a)
            arr = pylab.array(allNum).reshape(4,4)

            if checkArr(arr):
                print 'Solution:', arr
                break
    print 'Solution was not found'

Запускаем. Сначала решений нет, так как в сетах присутствуют «тяжелые кости»:

This is comb # 3 :
[(0, 0), (0, 1), (0, 2), (0, 3), (0, 4), (0, 5), (1, 1), (2, 5)]
Solution was not found

Но потом, начиная с энной комбинации, начинают сыпаться решения.
Брутфорсер получился меееедленный, но рабочий.
Ну вот и все. Теперь, если вы спросите меня, пригодились ли мне курсы edx в жизни, я гордо отвечу «Да!» и дам ссылку на эту статью.

Автор: imwode

Источник

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Применяем на практике знания, полученные на курсе MIT 6.00x (edx.org)

Китайские шашки

Домино

Архив

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Применяем на практике знания, полученные на курсе MIT 6.00x (edx.org)

Китайские шашки

Домино

Рекомендованный контент

Новости

Актуальные темы

Архив