Я пытаюсь использовать пул рабочих, предоставленный concurrent.futures.ProcessPoolExecutor
, чтобы ускорить работу метода внутри класса tkinter. Это связано с тем, что выполнение метода интенсивно использует процессор, а «распараллеливание» должно сократить время его выполнения. Я надеюсь сравнить его производительность с контролем - последовательное выполнение того же метода. Я написал тестовый код tkinter GUI для выполнения этого теста. Последовательное выполнение метода работает, но параллельная часть не работает. Ценю любую помощь, чтобы заставить параллельную часть моего кода работать.
Обновление: я убедился, что правильно реализовал concurrent.futures.ProcessPoolExecutor
для решения моей проблемы вне Tk(), то есть из стандартного скрипта python3. Это объясняется в этом ответе. Теперь я хочу реализовать параллельный метод, описанный в этом ответе, для работы с кнопкой в моем графическом интерфейсе tkinter.Tk().
Мой тестовый код приведен ниже. Когда вы запустите его, появится графический интерфейс. Когда вы нажимаете кнопку «НАЙТИ», функция _findmatch будет выполняться последовательно и параллельно, чтобы найти, сколько раз число 5 встречается в диапазоне чисел от 0 до 1E8. Последовательная часть работает, но параллельная часть жалуется (см. ниже). Кто-нибудь знает, как исправить эту ошибку Pickling?
Traceback (most recent call last):
File "/usr/lib/python3.5/multiprocessing/queues.py", line 241, in _feed
obj = ForkingPickler.dumps(obj)
File "/usr/lib/python3.5/multiprocessing/reduction.py", line 50, in dumps
cls(buf, protocol).dump(obj)
_pickle.PicklingError: Can't pickle <class '_tkinter.tkapp'>: attribute lookup tkapp on _tkinter failed
Тестовый код:
#!/usr/bin/python3
# -*- coding: utf-8 -*-
import tkinter as tk # Python 3 tkinter modules
import tkinter.ttk as ttk
import concurrent.futures as cf
from time import time, sleep
from itertools import repeat, chain
class App(ttk.Frame):
def __init__(self, parent):
# Initialise App Frame
ttk.Frame.__init__(self, parent, style='App.TFrame')
self.parent=parent
self.button = ttk.Button(self, style='start.TButton', text = 'FIND',
command=self._check)
self.label0 = ttk.Label(self, foreground='blue')
self.label1 = ttk.Label(self, foreground='red')
self.label2 = ttk.Label(self, foreground='green')
self._labels()
self.button.grid(row=0, column=1, rowspan=3, sticky='nsew')
self.label0.grid(row=0, column=0, sticky='nsew')
self.label1.grid(row=1, column=0, sticky='nsew')
self.label2.grid(row=2, column=0, sticky='nsew')
def _labels(self):
self.label0.configure(text='Click "FIND" to see how many times the number 5 appears.')
self.label1.configure(text='Serial Method:')
self.label2.configure(text='Concurrent Method:')
def _check(self):
# Initialisation
self._labels()
nmax = int(1E7)
smatch=[]
cmatch=[]
number = '5'
self.label0.configure(
text='Finding the number of times {0} appears in 0 to {1}'.format(
number, nmax))
self.parent.update_idletasks()
# Run serial code
start = time()
smatch = self._findmatch(0, nmax, number)
end = time() - start
self.label1.configure(
text='Serial: Found {0} occurances, Time to Find: {1:.6f}sec'.format(
len(smatch), end))
# Run serial code concurrently with concurrent.futures
workers = 6 # Pool of workers
chunks_vs_workers = 30 # A factor of =>14 can provide optimum performance
num_of_chunks = chunks_vs_workers * workers
start = time()
cmatch = self._concurrent_map(nmax, number, workers, num_of_chunks)
end = time() - start
self.label2.configure(
text='Concurrent: Found {0} occurances, Time to Find: {1:.6f}sec'.format(
len(cmatch), end))
def _findmatch(self, nmin, nmax, number):
'''Function to find the occurence of number in range nmin to nmax and return
the found occurences in a list.'''
start = time()
match=[]
for n in range(nmin, nmax):
if number in str(n): match.append(n)
end = time() - start
#print("\n def _findmatch {0:<10} {1:<10} {2:<3} found {3:8} in {4:.4f}sec".
# format(nmin, nmax, number, len(match),end))
return match
def _concurrent_map(self, nmax, number, workers, num_of_chunks):
'''Function that utilises concurrent.futures.ProcessPoolExecutor.map to
find the occurrences of a given number in a number range in a concurrent
manner.'''
# 1. Local variables
start = time()
chunksize = nmax // num_of_chunks
#2. Parallelization
with cf.ProcessPoolExecutor(max_workers=workers) as executor:
# 2.1. Discretise workload and submit to worker pool
cstart = (chunksize * i for i in range(num_of_chunks))
cstop = (chunksize * i if i != num_of_chunks else nmax
for i in range(1, num_of_chunks + 1))
futures = executor.map(self._findmatch, cstart, cstop, repeat(number))
end = time() - start
print('\n within statement of def _concurrent_map(nmax, number, workers, num_of_chunks):')
print("found in {0:.4f}sec".format(end))
return list(chain.from_iterable(futures))
if __name__ == '__main__':
root = tk.Tk()
root.title('App'), root.geometry('550x60')
app = App(root)
app.grid(row=0, column=0, sticky='nsew')
root.rowconfigure(0, weight=1)
root.columnconfigure(0, weight=1)
app.columnconfigure(0, weight=1)
app.mainloop()
self._serial
иself._concurrent
на поиск совпадения.self._serial
служит контролем. Я думаю, что хорошо написанный код сначала попытается реализовать вself._check
2 отдельных потока, чтобы запустить оба этих метода параллельно. Во-вторых,self._concurrent
должен содержать cmds, чтобы использоватьProcessPoolExecutor
для поиска совпадений и вывода результатов вlabel2
графического интерфейса. Я пытаюсь добиться этого, но пока не нашел способа сделать это. Я читал из другого поста, что параллельные cmds должны выполняться в основном, поэтому я сослался наself.parent
. - person Sun Bear   schedule 02.02.2017multiprocessing
используется для моей цели? Я спрашиваю, потому что читал, чтоconcurrent.futures
— это реализация API более высокого уровня дляmultiprocessing
иthreading
. Если это так, я думаю, что способ их использования для моего сценария должен применяться кconcurrent.futures
. - person Sun Bear   schedule 03.02.2017