Вопросы с тегами [python]

1

голосов
2

ответ
45

Просмотры

Splitting list to many lists with conditions

Я имею такой код, чтобы сделать 4 списков из одного с моими условиями. Это расщепление зависит от знака элементов списков. Как я хочу, чтобы получить список всех положительных, список со списками, где первые элементы являются положительными и второй отрицательны, и т.д ... И все комбинации, как это. Легко создать 4 списков с помощью фильтра, когда все списки containts только 2 элементов. Vals = [(0, 0), (0, 1), (0, -1), (1, 0), (1, 1), (1, -1), (-1, 0), (- 1, 1), (-1, -1)] = new_f список (фильтр (лямбда х: [0]> = 0, Vals)) new_f = лист (фильтр (лямбда-х: [1]> = 0, new_f)) печати (new_f) new_f = лист (фильтр (лямбда-х: [0] = 0, new_f)) печати (new_f) new_f = лист (фильтр (лямбда-х: [0]> = 0, Vals)) new_f = список (фильтр (лямбда х: х [1] = 0, new_f)) печати (new_f) new_f = лист (фильтр (лямбда-х: [0] = 0, new_f)) new_f = лист (фильтр (лямбда-х : х [2]> = 0, new_f)) печати (new_f) Здесь выводится: [(0, 0, 0), (0, 0, 1), (0, 1, 0),
1

голосов
2

ответ
41

Просмотры

Определение доли не имеет значение из столбца

Я читаю CSV с помощью панд, чтобы выполнить некоторый анализ на нем. Где я получаю эту ошибку ValueError: не удалось преобразовать строку плавать: «никто» Я проверил, я не буду получать эту ошибку из-за shift_zip параметра. Я вручную пошел в CSV-файл и openoffce и превращал этот столбец числовой. Но все-таки дает эту ошибку. Данные выглядит так я вручную проверил shift_zip колонки, но не может найти ни значение в нем. Я также попытался напечатать эти данные столбца и его тип данных, который дает. для Вала в данных [ «nurse_zip»]: # печать ((значение)), если типа (значение) = «INT»: печать (тип ((значение))) выход Как я правильно определить, какой NONE значения в этом столбце является причиной этой проблемы? Edit 1: Добавление большего количества кода для лучшего понимания: набор данных = pd.read_csv ( "model__newdata.csv", [] Изменение 1 Результат на jezrael ответ Это даст Ложные или Правда, как в состоянии. Не удается проверить, какая конкретная строка не является ни или пустым.
Jhon Patric
1

голосов
2

ответ
71

Просмотры

Best practice: how to pass many many arguments to a function?

Я бегу некоторые численные эксперименты, в которых моя главная функция должна получать много и много аргументов - я говорю от 10 до 30 аргументов в зависимости от моделирования для запуска. Каковы лучшие практики для обработки случаев, как это? Разделив код в, скажем, 10 функций, с 3-мя аргументами каждый не звучит очень возможно в моем случае. Если это не лучший форум для этого типа вопросов, вы можете порекомендовать где спросить? Что я могу сделать, это создать экземпляр класса (без методов), хранить входные данные в качестве атрибутов этого экземпляра, а затем передать экземпляр - так что функция принимает только один вход. Мне это нравится, потому что код выглядит чистым, легко читать, и потому что я считаю, что легко определить и запустить альтернативные сценарии. Мне не нравится, потому что доступ к классу атрибутов в функции происходит медленнее, чем доступ к локальной переменной (см: Как / почему для оптимизации кода путем копирования атрибутов класса для локальных переменных), а потому, что это не эффективное использование памяти - слишком много данных, хранящихся несколько раз без необходимости. Любые мысли / предложения / рекомендации? Большое спасибо! myinput = MyInput () myinput.input_sql_table = that_sql_table myinput.input_file = that_input_file myinput.param1 = param1 myinput.param2 = param2 myoutput = известково (myinput) Альтернативные сценарии: входы = collections.OrderedDict () сценариев = collections.OrderedDict () входы [ 'Базовый сценарий'] = copy.deepcopy (myinput) входы [ 'param2 = 100'] = copy.deepcopy (myinput) входы [ 'param2 = 100']. param2 = 100 # цикл через все входы и выходы магазинах в упорядоченный словарь сценарии
1

голосов
2

ответ
51

Просмотры

How do I evaluate multiple variables with one if statement

Я в настоящее время хранения значений, предоставляемых в ответ API, который возвращает XML, некоторые узлы возвращаются с «ложь» или «истина» Я захватывая эти значения в качестве строкового типа. XML код: ложь правда правда, я хочу, чтобы разобрать с помощью этих значений и если я найду матч я хотел бы изменить «истинный» к «на» и ложным «Off» в зависимости от переменной, которая соответствует. Я только в состоянии сделать это с одной переменной, моя цель состоит в том, чтобы очистить свой код и найти более эффективный способ, любой совет приветствуется. Вот мой блок кода: запросы на импорт импорта JSon импорта CSV из BS4 импорта BeautifulSoup данных в csv_reader: REQ = requests.get (URL, PARAMS = PARAMS) ответ = BeautifulSoup (req.text, 'LXML') = скрытый ответ. найти ( 'скрытый'). строка = SSL response.find ( 'SSL').
Aldo
1

голосов
1

ответ
39

Просмотры

Pandas: Crosstab on multiple columns then Groupby

I have the dataframe that looks like this. df visit_date sex region status 0 2019-04-01 m as pass 1 2019-04-02 m as pass 2 2019-04-02 f na pass 3 2019-04-03 f na fail 4 2019-04-08 f na pass 5 2019-04-09 f as pass 6 2019-04-09 m na pass 7 2019-04-10 m as fail 8 2019-04-15 f as fail 9 2019-04-15 m na pass 10 2019-04-16 f na pass 11 2019-04-17 f na fail visit_date is datetime and the rest are categorical (object). I want to count each value in each column by weekly then set them to columns. Expected Result. f m as na fail pass visit_date 2019-04-07 2 2 2 2 1 3 2019-04-14 2 2 2 2 1 3 2019-04-21 3 1 1 3 2 2 I used pd.crosstab and groupby. df.visit_date = pd.to_datetime(df.visit_date) cols = ['sex', 'region', 'status'] df2 = pd.crosstab(df['visit_date'], df[cols[0]]) for i in range(1, len(cols)): df2 = df2.join(pd.crosstab(df['visit_date'], df[cols[i]])) df2.groupby([pd.Grouper(level='visit_date', freq='1W')]).sum() f m as na fail pass visit_date 2019-04-07 2 2 2 2 1 3 2019-04-14 2 2 2 2 1 3 2019-04-21 3 1 1 3 2 2 The problem is I have to groupby again to sum them up in weekly and it too slow. My actual data have ~100+ columns and ~1 million+ rows. Is there any faster way to get the same result?
ResidentSleeper
1

голосов
2

ответ
44

Просмотры

python efficient way to append all worksheets in multiple excel into pandas dataframe

У меня есть около 20 ++ файлов XLSX, внутри каждого XLSX файлы могут содержать разное количество рабочих листов. Но, слава богу, все столбцы являются некоторыми во всех рабочих листах и ​​всех XLSX файлов. Ссылаясь на здесь «, я получил некоторое представление я пытался несколько способов импортировать и присоединять все первенствует файлы (все рабочего листа) в единый dataframe (около 4 миллиона строк записей). Примечание: я сделал чек здесь», как хорошо, но это только включить на уровне файлов, мой consits файл и вплоть до уровня рабочего листа. Я попытался ниже код # импорта всех необходимых пакета импорта панд, как э.р. из pathlib импорта Путь импорта Глоб импорт SYS # набора истока source_dataset_path = "C: / Users / AAA / Desktop / Sample_dataset /" source_dataset_list = glob.iglob (source_dataset_path + " сделки купли-продажи * ") для файла в source_dataset_list: #xls = э.р.. ExcelFile (source_dataset_list [I]) sys.stdout.write (ул (файл)) sys.stdout.flush () XLS = pd.ExcelFile (файл) out_df = pd.DataFrame () ## создать пустой выходной dataframe для листа в XLS .sheet_names: sys.stdout.write (ул (лист)) sys.stdout.flush () ## # Просмотр первенствовать имена файлов листов #df = pd.read_excel (source_dataset_list [я], название_листа = листов) DF = э.р.. read_excel (файл, SheetName = лист) out_df = out_df.append (ДФ) ## Это будет добавлять строки одного dataframe к другому (так же, как ожидаемому выход) Вопрос: Мой подход подобно первому прочитать каждый первенствовать архив и получить список листов внутри него, а затем загрузите листы и добавлять все листы. Перекручивание кажется не очень эффективным EXPECIALLY когда DataSize увеличения для каждого добавления.
yc.koong
1

голосов
2

ответ
21

Просмотры

Python Datetime с последовательным вопросом

Я пытаюсь написать сценарий, где 3 переменного список. во-первых, увидеть мой текущий сценарий: импорт DateTime, как дт импорта панд как э.р. х = [ «Йон лань», «GX»] у = [ «Donald Ted», «GY»] Z = [ «кузнец Джо», «Г.З. «] = start_date dt.datetime (2019, 4,12) end_date = dt.datetime (2019, 4,21) DateRange = pd.date_range (дата_начала end_date) на дату в DATERANGE: печать (дата) Я обеспокоен с этим довести выход как это: 12/04/2019, jhone лань, GX 13/04/2019, Donald Ted, GY 14/04/2019, кузнец jhoe, GZ 15/04/2019, jhone лань, GX 16/04 / 2019, Donald Ted, GY 17/04/2019, кузнец jhoe, GZ 18/04/2019, jhone лань, GX 19/04/2019, Donald Ted, GY 14/04/2019, кузнец jhoe, GZ 21/04 / 2019, jhone лань, GX это ясно, если вы видите мой ожидаемый результат. Может кто-нибудь сказать мне, как это сделать? в 3 переменных приведено выше.
newcoder
1

голосов
1

ответ
41

Просмотры

Python не может использовать ** вне определения функции

Отказ от ответственности: Я новичок в Python. Если вы читаете эту статью, она перечисляет ** как возможность распаковывать словари. Я пытался это. my_dict = { "key1": 1, "key2": { "inner_key": 3}} unpacked_dict = ** my_dict Возвращает: SyntaxError: недопустимый синтаксис Что я упускаю? Я знаю, что ** используется в основном с ** kwargs, моя проблема, что ** может быть использован только в определении функции?
0

голосов
0

ответ
17

Просмотры

Не могу понять, почему пятиугольник втягивается неправильно и не движется к правому, как и другие формы делают

Каждая кнопка в нижней части должна нарисовать заданные формы с параметрами справа. Треугольник и квадрат втянуться правильно, но при попытке нарисовать пятиугольник она не соприкасалась на кончике и не будет двигаться к правой exampleImage Heres моего кода: Защита drawTriangle (Я): цвет = self.favorite.get () толщина = INT (self.widthEntry.get ()) длина = INT (self.lengthEntry.get ()) self.canvas.create_line (self.x, self.y, self.x - (длина / 2), самостоятельно. у + длина, заполнить = цвет, ширина = толщина) self.x - = длина / 2 self.y + = длина self.canvas.create_line (self.x, self.y, self.x + длина, self.y, заполнить = цвет, ширина = толщина) self.x + = длина self.canvas.create_line (self.x, self.y, self.x - (длина / 2), self.y - длина, заполнить = цвет, ширина = толщина) self.x - = длина / 2 самостоятельно. self.y, self.x - (длина / 2), self.y + (длина / 3), заполняют = цвет, ширина = толщина) self.x - = длина / 2 self.y + = длина / 3 самостоятельно. canvas.create_line (self.x, self.y, self.x + (длина / 5), self.y + (длина * 2/3), заполняют = цвет, ширина = толщина) self.x + = длина / 5 self.y + = длина * 2/3 self.canvas.create_line (self.x, self.y, self.x + (длина * 4/5), self.y, заполнить = цвет, ширина = толщина) самостоятельно. х + = длина * 4/5 self.canvas.create_line (self.x, self.y, self.x + (длина / 5), self.y - (длина * 2/3), заполняют = цвет, ширина = толщина) self.x + = длина / 5 self.y - = длина * 2/3 self.canvas.create_line (self.x, self.y, self.x - (длина / 2), self.y - (длина / 3), заполняют = цвет, ширина = толщина) self.x - = длина / 2 self.y - = длина / 3 self.x + = 70 РЕДАКТИРОВАТЬ: Ничего себе я так глуп. Была простая математическая задача. Спасибо за помощь! Я прослежу, чтобы отладить еще перед публикацией здесь.
YabbaDabbaDoo
0

голосов
0

ответ
10

Просмотры

Как я могу выбрать входной сигнал от столбца, если он удовлетворяет несколько условий из разных столбцов в другой строке?

Я пытаюсь выбрать определенные входы, которые соответствуют моим условиям других столбцов и создать новый столбец с этим значением. Я попытался .merge, .loc IfElse и я по-прежнему есть что-то неправильное. У меня есть dataframe со следующими столбцами для нескольких акций [ «дата», «тикер», «bid_low», «ask_high», «цена»] и следующих столбцов для каждой опционной цепи [ «exdate», «strike_price», 'best_bid', 'best_offer', 'moving_avg']. Если условие выполнено из moving_avg быть ниже цены, которую я хочу, чтобы выбрать ближайший strike_price этой даты, а затем получить реальную отдачу, если удерживать пока exdate, который будет иметь другую «цену» и exdate будет = дата.
Rodrigo Lask.
2

голосов
2

ответ
37

Просмотры

python swaping values using comma is causing confusions

this involves a problem that I encountered when try to solve a linked-list reverse problem. First let me put some preliminary codes for the definition of the linked list and quick method to generate a linked list: class ListNode: def __init__(self, x): self.val = x self.next = None def __repr__(self): if self.next: return "{}->{}".format(self.val, repr(self.next)) else: return "{}".format(self.val) def genNode(*nodes, end=None): if len(nodes) == 1 and type(nodes[0]) == list: nodes = nodes[0] for i in nodes[::-1]: n = ListNode(i) n.next, end = end, n return n if nodes else None The problem I have is that I found the swapping mechanism is still depending on the sequence of the variable that I write. Originally when we talk about swapping values in python we can do: a, b = b, a and it should work the same way if I have b, a = a, b This reverse linked list method that I am trying to write has 3 variables swapping, the idea is simple, to create a dummy head, and consistently adding nodes between dummy and dummy.next, so that it can be reversed. def rev(head): dummy = ListNode('X') while head: dummy.next, head.next, head = head, dummy.next, head.next return dummy.next a = genNode(1,2,3,4) print(rev(a)) # >>> 4->3->2->1 But If I slightly switch the sequence of the 3 variables: def rev2(head): dummy = ListNode('X') while head: dummy.next, head, head.next, = head, head.next, dummy.next, return dummy.next a = genNode(1,2,3,4) print(rev2(a)) # >>> AttributeError: 'NoneType' object has no attribute 'next' So it does seem like that the sequence matters here, and can anyone let me know how python evaluate swapping values if there is more than 2 variables. Thanks!
16

голосов
8

ответ
1.3k

Просмотры

Есть ли вещий способ найти среднее число конкретных элементов кортежа в массиве?

Я хочу, чтобы написать этот код, как вещий. Мой реальный массив намного больше, чем в этом примере. (5 + 10 + 20 + 3 + 2) / 5 печати (np.mean (массив, ключ = лямбда-х: х [1])) Ошибка типа: среднее () получили неожиданный аргумент ключевого слова 'ключ' массив = [(» а», 5), ( 'B', 10), ( 'с', 20), ( 'd', 3), ( 'е', 2)] сумма = 0 для г в диапазоне (LEN (массив) ): сумма = сумма + массив [я] [1] = средняя сумма / Len (массив) печати (средний) импорт NumPy в н.п. печати (np.mean (массив, ключ = лямбда х: [1])) Как можно избежать этого? Я хочу использовать второй пример.
Şevval Kahraman
0

голосов
1

ответ
15

Просмотры

Геокодирования возвращения неправильно Шир /

Я использую этот код, чтобы геокодирования этот адрес, чтобы получить лат и долго, но она возвращается неправильные координаты. импорт запросов адрес = '50 Бега St, Tathra NSW 2550, Австралия»ответ = requests.get ( 'https://maps.googleapis.com/maps/api/geocode/json?address= адрес & ключ = ****' ) resp_json_payload = response.json () для печати (resp_json_payload) печати (resp_json_payload [ 'результаты'] [0] [ 'геометрии'] [ 'местоположение']) Ожидаемый результат: -36,730478 149,985058 Фактический результат: 'ш': 37,09024, ' LNG ": -95,712891
vartika
1

голосов
1

ответ
13

Просмотры

Как сравнить значение строки по индексу и столбца и применить AND OR логика в dataframe?

У меня есть dataframe, который выглядит следующим образом: col1 0 Ofcourse 1 Я люблю Услугу dataframe также может иметь это значение для строки 1: col1 0 Ofcourse 1 Ненавижу службу я хочу, чтобы сравнить значение строк по строкам и столбцам и быть в состоянии проверить одно из двух значений в row1. Я хочу создать эту логику: если df.col1.loc [[0]] == «Конечно!» и (df.col1.loc [[1]] == 'Я люблю службу' или df.col1.loc [[1]] == 'Я ненавижу услугу'): печать ( 'хорошо') Когда я бегу логика выше, я получаю ошибку: ValueError: значение истинности серии неоднозначна. Использование a.empty, a.bool (), a.item (), a.any () или a.All (). Что я делаю неправильно?
RustyShackleford
0

голосов
0

ответ
22

Просмотры

Design neural network to find inputs with highest probability of class

I am designing a neural network for classification with the aim to find the inputs with the highest probability that they belong to one of two classes. There are two classes, class A and class B. I have a set of data of which I want to find the inputs that have the highest probability that they belong to class B. This is different to conventional classification in that I'm not interested in the correct labelling of all inputs. I'm only interested in the correct labelling of the inputs that are labelled with a high probability to belong to class B. So the accuracy of the network could be calculated like this: Train the neural network Feed the validation data into the network Sort the resulting outputs, together with the known targets, by the returned probability for class B Take the top N samples, e.g. top 1% (now we have the outputs with the highest probability for class B) Count how many of the taken samples were actually of class B The accuracy is the number of actual instances of class B counted, divided by the number of samples taken N Say, we have a simple network like this: model = keras.Sequential([ keras.layers.Dense(7, input_dim=len(inputs_training[0]), activation=tf.nn.relu, kernel_regularizer=keras.regularizers.l2(0.0)), keras.layers.Dense(7, activation=tf.nn.relu, kernel_regularizer=keras.regularizers.l2(0.000001)), keras.layers.Dense(7, activation=tf.nn.relu, kernel_regularizer=keras.regularizers.l2(0.000001)), keras.layers.Dense(1, activation=tf.nn.sigmoid, kernel_regularizer=keras.regularizers.l2(0.00000)) ]) model.compile(optimizer='adam', loss=binary_crossentropy, metrics=['accuracy']) model.fit( np.array(inputs_training), np.array(targets_training), epochs=15, verbose=0, class_weight={0: 1, 1: 4} ) The problem is that, the more features (inputs) I add, the less accurate the prediction becomes - even though each features performs well on it's own. For example, I can use a single feature that gives me 40% accuracy in the top 1%. If I add two more features that perform similarly on their own, the accuracy drops to, say, 25-30%. Class B makes about 15% of the data. The second problem is that the accuracy in the top 1% fluctuates a lot. I have tried: Changing the number of layers / neurons, epochs Changing the class weights Changing regularisation parameters, including using l1 Trying different loss functions I speculate that none of this works because the neural network is optimising for the classification of all inputs, not optimizing to produce the highest accuracy in the top 1%. Is there a way how I can stir the neural network to optimize so that the most probable results are correct, but the remaining 99% can tend to be mislabelled? Demo code: https://pastebin.com/CnDpCjdp
ig-dev
0

голосов
1

ответ
14

Просмотры

не может разделить большой файл .txt в поезд, тестирования и проверки деталей для глубокого текста корректором

У меня есть один большой файл .txt, и я хочу, чтобы разбить его на поезд, испытание и набор проверки. ниже строки кода, где я хочу, чтобы использовать эти мушки. Я не получаю интуиции о том, как это сделать. питон correct_text.py --train_path /movie_dialog_train.txt \ --val_path /movie_dialog_val.txt \ --config DefaultMovieDialogConfig \ --data_reader_type MovieDialogReader \ --model_path / movie_dialog_model
SRajput
0

голосов
0

ответ
8

Просмотры

Создание DropDown от модели в Django

Я ищу, чтобы создать выпадающий список в шаблоне, где значение выпадающего списка приходит из поля (ссылка) в моем Orders модели в models.py. Я понимаю, создание выпадающего меню, где значения устанавливаются статически, но так как я ищу, чтобы заполнить с значениями, хранящимися в БД, я не уверен, где начать. Я создал модель и попытался играть с views.py, forms.py и шаблоны. Я в состоянии получить каждый из порядковых номеров для отображения, но не в выпадающем меню, и я борюсь с тем, как написать свой шаблон. MODELS.PY от django.db моделей заказов на импорт класса (models.Model): ссылка = models.CharField (max_length = 50, пробел = False) ultimate_consignee = models.CharField (max_length = 500) ship_to = models.CharField (max_length = 500 ) Защита _str_ (Я): возвращение self.reference ФОРМА. метка}} {{поле}} {% ENDFOR%} Добавить Order {%}% концевого блок Все, что я получаю, когда я вынести шаблон каждый из эталонных #s перечисленных вне, но НЕ в раскрывающемся меню. Это приводит меня к мысли, моя проблема заключается в основном в шаблоне, но я не уверен, как я новичок в использовании Django.
GXM100
0

голосов
0

ответ
9

Просмотры

Разделительная словари

Я довольно новыми для питона программирования и в настоящее время работает на данные науки пути DataQuest в. Я озадачен на их разделяющей уступке словарей. Если кто-нибудь может объяснить, шаг за шагом, что делать или показать мне некоторые внешние ресурсы, я был бы признателен. Это проблема: Раньше мы преобразовали частоты в пропорции или проценты путем перезаписи исходного словаря значения. Тем не менее, мы часто должны держать словари отдельно для последующего анализа. Например, мы могли бы иметь три отдельные словарей: один хранящие частоты, еще хранящие пропорции, и еще складирование проценты. Когда мы преобразуем частоту пропорций, мы можем создать новый словарь вместо перезаписи значений в исходном словаре. Чтобы сделать это, мы можем создать новый пустой словарь и заполнить его в цикле: Для того, чтобы получить лучшее понимание того, как это работает, мы будем печатать переменные итерации, долю, и новый словарь для каждой итерации: Давайте теперь практиковать эту технику, выполнив несколько упражнений. Инструкции преобразования частоты внутри content_ratings в пропорции и проценты, создавая отдельные словари для каждого из них. Назначает словарь, хранящие пропорции переменной с именем c_ratings_proportions. Назначают словарь, хранящий проценты переменной с именем c_ratings_percentages. Дополнительно задача: попытаться решить это упражнение, используя один цикл (решение этой задачи при условии). Инструкции преобразования частоты внутри content_ratings в пропорции и проценты, создавая отдельные словари для каждого из них. Назначает словарь, хранящие пропорции переменной с именем c_ratings_proportions. Назначают словарь, хранящий проценты переменной с именем c_ratings_percentages. Дополнительно задача: попытаться решить это упражнение, используя один цикл (решение этой задачи при условии). Инструкции преобразования частоты внутри content_ratings в пропорции и проценты, создавая отдельные словари для каждого из них. Назначает словарь, хранящие пропорции переменной с именем c_ratings_proportions. Назначают словарь, хранящий проценты переменной с именем c_ratings_percentages. Дополнительно задача: попытаться решить это упражнение, используя один цикл (решение этой задачи при условии).
user11385063
0

голосов
0

ответ
5

Просмотры

Python moviepy читатель не определен при написании видеофайла

Я пытаюсь объединить несколько наборов AudioFileClip-х и ImageClip-х в одном фильме. Но у меня возникают странные ошибки, я потратил много времени, и пытался много вещей, чтобы попытаться и заставить его работать. Я пробовал: Создание один комбинированный AudioClip, а затем добавить его к объединенным ImageClips вместо добавления кучи ImageClips, что уже есть аудио присоединенных различных способы ввода клипов вместе, такие как .set_audio и с помощью температуры аудиофайла при записи клипа на файл Тестирование аналогичной ситуации в консоли, которая работала поиск и поиск по moviepy документов и предыдущие вопросы moviepy редактора импорта как мки из ГТЦ импорт ГТЦ из теста mutagen.mp3 импорта MP3 класса: Защита __init __ (самостоятельно): self.clips = [ ] Защита add_clip (сам, текст, picture_path, audio_path): TTS = ГТЦ (текст) TTS. каждый поздоровавшись с помощью TTS. TTS работает отлично и выводит mp3 правильно, он отлично работает, когда я закомментируйте set_audio линии, но когда я объединить все клипы в один mp4 имеет ошибку. AttributeError: объект «NoneType» не имеет атрибута «get_frame» Full Error: https://mystb.in/ulusafajan.rb Ни один из объектов в списке нет ни одного, и я запутался, почему каскадный клип оленьей кожи у читателя любые и все помощь приветствуется! Спасибо! гь Ни один из объектов в списке нет ни одного, и я запутался, почему каскадный клип оленьей кожи есть карды Любой помощи приветствуется! Спасибо! гь Ни один из объектов в списке нет ни одного, и я запутался, почему каскадный клип оленьей кожи есть карды Любой помощи приветствуется! Спасибо!
0

голосов
2

ответ
119

Просмотры

pdf2image как читать PDF-файлы с «включить все функции» - окна

У меня есть PDF и я хотел бы, чтобы прочитать это в Python. Когда я открываю его на моей машине с помощью акробата, я получаю сообщение ниже, и когда я нажимаю на «включить все функции», файл показывает его реальное содержание. Когда я пытаюсь читать в питоне, как я мог бы достичь тех же действий, так что питон читает сам текст и не читать текст ниже «Пожалуйста, подождите ... Если это сообщение не в конечном итоге заменить соответствующие содержаниями документ, ваш зритель PDF не может быть в состоянии отображать этот тип документа. Вы можете обновить его до последней версии Adobe Reader для Windows®, Mac или Linux®, посетив http://www.adobe.com/go/reader_download . Для получения дополнительной помощи с Adobe Reader посетите http://www.adobe.com/go/acrreader. Окна является зарегистрированным товарным знаком или товарным знаком корпорации Microsoft в США и / или других странах. Mac является торговой маркой компании Apple Inc., зарегистрированной в США и других странах. Linux является зарегистрированным товарным знаком Линуса Торвальдса в США и других странах. "Мой код ниже от PIL Импорт изображений импорт pytesseract HOMEPATH = r'C: \ Users \ хххх \\» файлы = "bbbb.pdf" PDFfilename = HOMEPATH + файлы из pdf2image импорта convert_from_path страниц = convert_from_path (PDFfilename, 500) я = 1 для страницы в страницах: page.save (HOMEPATH + 'из' ул (я +) + 'JPG', 'JPEG') текст = pytesseract.image_to_string (Image.open (HOMEPATH + 'из' ул (я + ) + 'JPG')) печать (текст) я = я + 1 зарегистрированной в США и других странах. Linux является зарегистрированным товарным знаком Линуса Торвальдса в США и других странах. "Мой код ниже от PIL Импорт изображений импорт pytesseract HOMEPATH = r'C: \ Users \ хххх \\» файлы = "bbbb.pdf" PDFfilename = HOMEPATH + файлы из pdf2image импорта convert_from_path страниц = convert_from_path (PDFfilename, 500) я = 1 для страницы в страницах: page.save (HOMEPATH + 'из' ул (я +) + 'JPG', 'JPEG') текст = pytesseract.image_to_string (Image.open (HOMEPATH + 'из' ул (я + ) + 'JPG')) печать (текст) я = я + 1 зарегистрированной в США и других странах. Linux является зарегистрированным товарным знаком Линуса Торвальдса в США и других странах. "Мой код ниже от PIL Импорт изображений импорт pytesseract HOMEPATH = r'C: \ Users \ хххх \\» файлы = "bbbb.pdf" PDFfilename = HOMEPATH + файлы из pdf2image импорта convert_from_path страниц = convert_from_path (PDFfilename, 500) я = 1 для страницы в страницах: page.save (HOMEPATH + 'из' ул (я +) + 'JPG', 'JPEG') текст = pytesseract.image_to_string (Image.open (HOMEPATH + 'из' ул (я + ) + 'JPG')) печать (текст) я = я + 1
user2543622
0

голосов
0

ответ
5

Просмотры

Группировка QuerySet по значению столбца

У меня есть QuerySet, возвращающие задачи по идентификатору клиента из следующих моделей и хотел бы получить еще несколько фильтров, чтобы получить более уточненные данные. Модели являются лишь примером структурой, что я пытаюсь достичь: класс Client (models.Model): Имя = models.CharField (max_length = 255) Защита __str __ (Я): возвращение класса self.name офис (models.Model): имя = models.CharField (max_length = 255) ClientID = models.ForeignKey (Клиент, db_constraint = False, db_index = False, on_delete = models.DO_NOTHING) Защита __str __ (Я): возвращение класс self.name Площади (models.Model): имя = models.CharField (max_length = 255) officeid = models.ForeignKey (Office, db_constraint = False, db_index = False, on_delete = models.DO_NOTHING) Защита __str __ (Я): возвращение self.name класс Task (models.Model): имя = модели. CharField (max_length = 255) Areaid = models.ForeignKey (площадь, db_constraint = False, db_index = False, on_delete = models.DO_NOTHING) Запрос, что я использую: Task.objects.filter (areaid__officeid__clientid = '1') возвращает длинный QuerySet, что мне нужно группе Areaid. Группировка Я имею в виду, например, получение списка нескольких querysets, которые содержат только задачи для одного Areaid. Есть ли возможность достичь этого Джанго ОРМ без зацикливания через QuerySet у меня уже есть? Мне это нужно, чтобы сделать различные таблицы в Jinja2, уникальную таблицу для каждого Areaid. Группировка Я имею в виду, например, получение списка нескольких querysets, которые содержат только задачи для одного Areaid. Есть ли возможность достичь этого Джанго ОРМ без зацикливания через QuerySet у меня уже есть? Мне это нужно, чтобы сделать различные таблицы в Jinja2, уникальную таблицу для каждого Areaid. Группировка Я имею в виду, например, получение списка нескольких querysets, которые содержат только задачи для одного Areaid. Есть ли возможность достичь этого Джанго ОРМ без зацикливания через QuerySet у меня уже есть? Мне это нужно, чтобы сделать различные таблицы в Jinja2, уникальную таблицу для каждого Areaid.
tookas92
1

голосов
1

ответ
1.3k

Просмотры

Оптимальная длина функции Python (Style) [закрыт]

Возможно, это не правильное место, чтобы задать этот вопрос, и часть меня думает, что нет никакого реального ответа на него, но мне интересно посмотреть, что опытные пользователи Python должны сказать по этой теме: Для обеспечения максимальной читаемости, краткости, и полезность, что диапазон для оптимальной длины функции Python? (При условии, что эта функция будет использоваться в сочетании с другими функциями, чтобы сделать что-то полезное.) Я понимаю, что это невероятно зависит от поставленной задачи, но как Второкурсник Comp. Sci. майор, один из наиболее последовательных указаний профессоров для написания программ, которые состоят из коротких функций так, чтобы разбить их на «простые», дискретные задачи. Я сделал большой рыть, в том числе через стиль руководства Python, но я не придумать хороший ответ. Если есть какой-либо опытный Python пользователи, которые хотели бы весить на эту тему, я был бы признателен за понимание. Благодарю.
austin_sherron
-2

голосов
1

ответ
25

Просмотры

Почему в условии с «мод» выдает два ответа?

Не могу понять почему в условии "мод" выдает два ответа. Должно при вводе: 5,0 0,0 мод Получится ответ: Деление на 0! Но выдает: Деление на 0! 0,0 Вот код: а = с плавающей точкой (вход ()) б = поплавок (вход ()) D = вход () с = поплавок () для печати (б) если d == "+": с = а + б, если d = = "-": с = а - Ь, если d == "/": если б == 0,0: печать ( "! деление на 0") остальное: с = а / б, если d == "*": с = A * B, если d == "мода": если б == 0.0: печать ( "Деление на 0!") остальное: с = а% Ь, если г == "POW": с = пау (а, б), если d == "DIV": C = DIV (а, б) печать (с) Должно при вводе: 5.0 0.0 мод Получится ответ: Деление на 0!
1

голосов
3

ответ
1.3k

Просмотры

Как удалить содержимое во вложенных тегах с BeautifulSoup?

Как удалить содержимое во вложенных тегах с BeautifulSoup? Эти сообщения показали обратное, чтобы извлечь содержимое в вложенных тегах: Как получить содержимое вложенного тега с помощью BeautifulSoup и BeautifulSoup: Как извлечь все S из списка с, который содержит несколько вложенных сек? Я попытался .text, но она удаляет только теги >>> из BS4 импорта BeautifulSoup как шс >>> HTML = «Что-то что-то бла-бла-то» >>> бс (HTML) .find_all ( «Foo») [0] Что-то что-то бла-бла-то еще >>> бс (HTML) .find_all ( «Foo») [0] .text u'Something что-то бла-бла-то другое»Желаемый результат: что-то что-то что-то другое
alvas
3

голосов
2

ответ
21

Просмотры

Dataframe GroupBy - список значений

У меня есть следующий dataframe: driver_id статус dttm 9f8f9bf3ee8f4874873288c246bd2d05 бесплатно 2018-02-04 00:19 9f8f9bf3ee8f4874873288c246bd2d05 занят 2018-02-04 1:03 8f174ffd446c456eaf3cca0915d0368d бесплатно 2018-02-03 15:43 8f174ffd446c456eaf3cca0915d0368d 2018-02-03 17:02 по маршруту 3 колонки: driver_id, статус, dttm Что мне нужно сделать, это группы по идентификатору водителя и сделать список всех статусов с их соответствующими значениями dttm в новую колонку под названием «driver_info»: driver_id driver_info 9f8f9bf3ee8f4874873288c246bd2d05 [( «свободный», 2018-02- 04 00:19), ( "занят", 2018-02-04 1:03)] 8f174ffd446c456eaf3cca0915d0368d [( "свободный", 2018-02-03 15:43), ( "по маршруту", 2018-02-03 17: 02) ...] Как сделать это в Python 3? Я попытался ДФГ = df.groupby (»
Egor Maksimov
0

голосов
0

ответ
3

Просмотры

How to fix 'Object arrays cannot be loaded when allow_pickle=False' in the sketch_rnn algorithm

Я управлял sketch_rnn.ipynb на моем jupyter ноутбуке, при загрузке среды для загрузки обученного набора данных, то возвращается ошибка «массивы объектов не может быть загружена, когда allow_pickle = False» Этот код уже используются разработчиками Google в разработке sketch_rnn алгоритм, который был работать даже в colab Google. В прошлом я пытался это сам по colab Google он работал, но, кажется, не будет работать на моем собственном jupyter ноутбука от magenta.models.sketch_rnn.sketch_rnn_train импорта * из magenta.models.sketch_rnn.model импорта * из magenta.models. sketch_rnn.utils импортировать * из magenta.models.sketch_rnn.rnn импорта * model_params.batch_size = 1 eval_model_params = sketch_rnn_model.copy_hparams (model_params) eval_model_params.use_input_dropout = 0 eval_model_params.use_recurrent_dropout = 0 eval_model_params.
Duncan Jerry
1

голосов
3

ответ
4.7k

Просмотры

Как установить 3. библиотеки партию в анаконду, если он не находится в списке Конды

У меня есть общая проблема о модуле импорта. Большое спасибо. Ситуация следующая: У меня есть питон сжатый пакет * .tar.gz Этот пакет не может быть найден в списке Конда, если я распакованы и использовать «питон setup.py установить» пакет действительно будет установлен в системе питон, а именно пользователь / местный / Библиотека / питон 2,7 / сайт-пакеты, но распределение анаконды, что вызывает проблему, если я начну питон в распределении анаконд это установленный пакет не может получить доступ к. Так есть ли прямое решение этой проблемы? Во-вторых, я запутался в чем разница между ~ анаконда / окр и virtualenv большое спасибо
Hello lad
1

голосов
2

ответ
1.4k

Просмотры

Исходный алгоритм ([источник, целевой, вес, G)] функции NetworkX shortest_path

Я делаю некоторую работу с NetworkX и использовал два кратчайших путь алгоритмы, а именно: shortest_path (G [, источник, цель, вес]) dijkstra_path (G, источник, цель [, вес]) Я понимаю, что dijkstra_path (G, источник, цель [, вес] функция) основана на алгоритме кратчайшего пути Дейкстров. Я хотел бы знать алгоритм источника, на котором ([,, источник, целевой вес] G) базируется shortest_path функции. Мне это нужно, потому что я должен сообщить об алгоритмах, которые я использовал. Я искал некоторые StackOverflow страницы, как NetworkX - Кратчайшую длину пути и все кратчайшие пути для взвешенных графов с NetworkX? но они не совсем ответ на мой вопрос, я также внимательно посмотреть на NetworkX документации и других статей на Google и не получили нашел ответ. Может кто-то пожалуйста, помогите мне с этой информацией. Спасибо
Nobi
1

голосов
2

ответ
1.3k

Просмотры

Python регулярное выражение матч квадратный вопрос скобка

Я пытаюсь соответствовать datatime в квадратных скобках, и я думал, что префиксы «\» будет способ кодирования квадратных скобок, но как-то это не сработало. Вот мой код: ( "[? (P \ S +) -700 \] \" г "" "", re.IGNORECASE) импорт повторно line_nginx = re.compile матч = line_nginx.match ( "[07 / Октябрь / 2014 : 19: 43: 08 -0700] "), если матч: печать (" соответствие ") иначе: печать (" не ровня ") я не получил "не матч". Любая идея, что пошло не так?
kee
0

голосов
1

ответ
17

Просмотры

Почему это Go Под 0

У меня есть работающая программа, которая является частью «Гоночная игра» Однако, когда игра, как предполагается, до конца не, а оставшаяся длина гонки идет вниз в негативов. Я пытался сказать только тогда, когда оставшаяся длина гонки выше 0 пробега и когда = до 0 остановки, но она по-прежнему продолжает импорт случайной печать ( "Эта игра является гонкой, где вы можете выбрать дистанцию ​​гонки, а затем кости свернуты «) округляет = 0, а True: попробуйте: race_length = INT (вход (» Выберите длину Вы хотели бы Вы расу (между 5 и 15) «)), за исключением ValueError: печать (» Извините, я не понял, что . ") #if целого число не введен сделать петлю выше, чтобы избежать ошибок и продолжать еще:
Lach D
1

голосов
2

ответ
369

Просмотры

Вызов и исполняемым и получать заданы параметры его STDOUT более эффективно в Python Script

Я пишу скрипт, который принимает долготу и широту и запускает их через исполняемый под названием gdallocationinfo. Исполняемый имеет широту и долготу в качестве аргументов и возвращает его STDOUT в качестве значения для этой координаты. Я читал о подпроцессов и мне было интересно, если это наиболее эффективный способ осуществить это, если я хочу, чтобы запустить много точек. Это, кажется, принимает очень много времени. Защиту gdalgetpointdata (долгота, широта): Учеб = subprocess.Popen ([ "gdallocationinfo",. "C: \ Users \ Data \ поп", "- WGS84", "- valonly", формат "{0}" (долгота) , "{0}". формат (широта)], стандартный вывод = subprocess.PIPE, оболочки = True) (вне, ERR) = Proc. общаться () возвращает Int (уходит) Есть ли лучший способ вызвать этот исполняемый файл без того, чтобы сделать новый суб-процесс каждый раз, когда я запускаю свою функцию? Есть ли что-то я мог бы сделать, чтобы ускорить его? Как примечание стороны, я знаю, что если вы запустите исполняемый файл из командной строки, он будет продолжать принимать STDIN и давать в STDOUT Выходы, пока не скажет, что бросить ()
Grant
1

голосов
2

ответ
1.2k

Просмотры

Нет ПОДВЕРГАТЬ в AWS докер терпит неудачу развертывания

У меня есть Scrapy проект запуска непрерывно на хронах размещенных внутри Docker изображения. Когда я бегу и развернуть это локально все работает отлично. Если я пытаюсь развернуть то же самое AWS я получаю следующее сообщение об ошибке внутри журналов: Нет ПОДВЕРГАТЬ директиву найденной в Dockerfile, прервать развертывание (ElasticBeanstalk :: ExternalInvocationError) Консоль показывает, что мой контейнер был построен правильно, но я не могу использовать его без КОНТАКТЕ порт. INFO: успешно вытащил питон: 2,7 WARN: Не удался не строить Docker изображения aws_beanstalk / промежуточное-приложение, повторное подключение ... INFO: успешно построено aws_beanstalk / постановка-приложение ОШИБКУ: Нет ПОДВЕРГАТЬ директиву найденной в Dockerfile, прервать ОШИБКУ развертывания: [Instance: я -6eebaeaf] Сбой команды на экземпляре. нет Код возврата: 1 Вывод: Нет ПОДВЕРГАТЬ директиву найденную в Dockerfile, прервать развертывание. Крюк /opt/elasticbeanstalk/hooks/appdeploy/enact/00run.sh не удалось. Для более подробной информации, проверьте /var/log/eb-activity.log с помощью консоли или EB CLI. Выполнение команды завершено во всех случаях: INFO. Краткое описание: [Успешная: 0, Сбой: 1]. Но почему это не возможно? Мой Dockerfile выглядит следующим образом: из питона: 2,7 MAINTAINER XDF ENV КАТАЛОГ / Opt / с-бемоль # Система ########## RUN APT-получить обновление -y && APT-получить обновление -y && apt- получить установку -y НТП ВИМ APT-Utils WORKDIR $ DIRECTORY # GIT ########## # http://stackoverflow.com/questions/23391839/clone-private-git-repo-with-dockerfile RUN склонный -get установить -y мерзавец RUN MKDIR /root/.ssh/ ADD развернуть / ГИТ-deply ключ /root/.ssh/id_rsa RUN CHMOD 0600 /root/.ssh/id_rsa RUN сенсорного /root/.ssh/known_hosts RUN SSH -keyscan -t bitbucket.org >> RSA /root/.ssh/known_hosts RUN SSH -T -o 'ConnectionAttempts = 1' GIT @ Bitbucket. орг RUN мерзавец клон --verbose [email protected]: XDF / заместитель flat.git. # Установите ########## RUN пункт установить Scrapy RUN пункт установить MySQL-питон # не работает # APT-получить установку -y wkhtmltopdf && пип установить pdfkit # еще # https://pypi.python.org/ PyPI / pdfkit RUN DEBIAN_FRONTEND = неинтерактивный APT-получить установку -y OpenSSL наращивание существенно Xorg libssl-DEV RUN Wget http://wkhtmltopdf.googlecode.com/files/wkhtmltopdf-0.10.0_rc2-static-amd64.tar.bz2 RUN деготь xvjf wkhtmltopdf-0.10.0_rc2 статический-amd64.tar.bz2 RUN Чаун корень: корень wkhtmltopdf-amd64 RUN мв wkhtmltopdf-amd64 / USR / бен / wkhtmltopdf RUN пункта установить pdfkit # Cron ########## # http://www.ekito.fr/people/run-a-cron-job-with-docker/ # http://www.corntab.com/pages/crontab-gui RUN APT-получить установку -y хрон RUN кронтаб "$ {ТЕЛ} / развернуть / кронтаб" CMD [ "-f" "хрон",]
lony
0

голосов
0

ответ
21

Просмотры

Уменьшение количества запросов к списку элементов с такой же в линии изменяемого поля визуализации

В то время отображения таблицы элементов, если значение поля для X не определен, он отображается как элемент выбора. Django делает запрос для каждого выбора элемента, и они могут добавить и привести к задержкам в больших таблицах. Что такое лучший способ уменьшить количество запросов? views.py от rest_framework импорта рендереров из класса rest_framework.response импорта Ответ ItemViewSet (viewsets.ModelViewSet): QuerySet = models.Item.objects.select_related ( "bought_by") serializer_class = serializers.ItemSerializer filterset_fields = ( "bought_by") renderer_classes = [ renderers.JSONRenderer, renderers.BrowsableAPIRenderer, renderers.TemplateHTMLRenderer] защиту список (Self, запрос, * арг ** kwargs): QuerySet = self.filter_queryset (self.get_queryset ()), если request.accepted_renderer.format == "HTML" : пункты = я. HTML {% статическая нагрузка%} {% нагрузки rest_framework%} {%, если items_info%} {% csrf_token%} Имя Активный куплено {% для пункта в пунктах%} {{item.name}} {{item.active}} {% стиль render_field serializer.bought_by = стиль%} {% ENDFOR%} {%}% еще нет ничего, чтобы показать. {% ENDIF%} Если есть три элемента, один запрос каждый будет получить serializer.bought_by. Я думал, что Django / ФПИ будет просто повторно использовать значение, но это запрос для каждого цикла. Пытаясь пройти «сериализатор-купил-под»:. Self.get_serializer () bought_by в ответ я получаю AttributeError: объект «ItemSerializer» не имеет attribute'bought_by»Печать сериалайзера я вижу: >> > Печать (self.get_serializer ()) ItemSerializer (контекст = { 'запрос': 'Формат': Нет, 'Вид':}): URL = HyperlinkedIdentityField (имя_представления = 'MyApp: деталь-деталь') = имя CharField ( уникальный = True, max_length = 50) = активный BooleanField (требуется = False) bought_by = SlugRelatedField (allow_null = True, QuerySet =, требуется = False, slug_field = 'имя') есть ли способ, чтобы передать bought_by в шаблон? Или я должен использовать JS; оказывать поле формы вне цикла и клон / дублировать каким-то образом? --- Изменения --- По желанию Эндре в: models.py класса покупателя (models.Model): Имя = models.CharField (уникальный = True, max_length = 20) класса Item (models.Model): Имя = models.CharField (уникальный = True, max_length = 50) = активный models.BooleanField (по умолчанию = True) bought_by = models.ForeignKey (Покупатель, нуль = True, пусто = True,
silverstripes
1

голосов
3

ответ
1.4k

Просмотры

PyTest: тест, функция был вызван в заявлении, если

У меня есть функция, которая рассматривает три различных случая, и для каждого случая вызывает другую функцию, как в примере ниже четкости my_fun (вход): если вход == 1: fun1 (), если вход == 2: fun2 (), если входное == 3: fun3 () Я хотел бы написать тест для функции my_fun с помощью py.test, но я не знаю, как я могу проверить, если надлежащее функция была вызвана для данного входа?
Ziva
0

голосов
1

ответ
17

Просмотры

Многопроцессорные «Бассейн» висит на выполнении программы

Я написал программу, чтобы использовать «пул» из многопроцессорных пакета питона, но он продолжает висеть ядро. (Я использую Jupyter с Anaconda, кстати), я попытался с помощью функции из импортируемого пакета, как «математика», который отлично работает, но в тот момент я использую функцию я созданный в том же файле питона он не работает. импорта многопроцессорная, как Т. пл четкости F (х): для я в х: возвращение + 1 ар = [1,2,3,4,5] Защиту главное (): бассейн = mp.Pool (процессы = 4) pool.map (е, аг), если __NAME __ == «__main__»: основной () Это показывает, что ядро ​​работает, но использование процессора находится на уровне 0%.
Chandra Sangala
1

голосов
3

ответ
1.6k

Просмотры

Plot some numbers in x axis

My question is related to the figure format generated using the matplotlib library. So, in the x axis, I have the integers from 1 to 100, but in my code I plot just the data related to some numbers (e.g 1,5,77,86,97). At the end, my code shows me a figure with x axis from 1 to 100. How can I show just the needed numbers (1,5,77,86,97)? My code is shown below: def Plot(self,x,y, steps, nb,bool): if(bool == False): labelfont = { 'family' : 'sans-serif', # (cursive, fantasy, monospace, serif) 'color' : 'black', # html hex or colour name 'weight' : 'normal', # (normal, bold, bolder, lighter) 'size' : 20, # default value:12 } titlefont = { 'family' : 'serif', 'color' : 'black', 'weight' : 'bold', 'size' : 20, } x = np.array(x) y = np.array(y) pylab.plot(x, y, 'darkmagenta', # colour linestyle='', # line style linewidth=10, # line width marker = '+', mew=6, ms=12) axes = plt.gca() axes.grid(True) axes.set_xlim([1, x_max) # x-axis bounds axes.set_ylim([1, nb]) # y-axis bounds pylab.title('Title' , fontdict=titlefont) pylab.xlabel('x', fontdict=labelfont) pylab.ylabel('y', fontdict=labelfont) pylab.subplots_adjust(left=0.15) # prevents overlapping of the y label else: test_steps.insert(0,"") pylab.yticks(nb, steps,rotation=0, size=10) pylab.margins(0.2) pylab.xticks(np.arange(0, x_max, 1.0),rotation=90, size=10) # Tweak spacing to prevent clipping of tick-labels pylab.subplots_adjust(bottom=0.15) F = pylab.gcf() DefaultSize = F.get_size_inches() if x_max < 100 and len(steps) < 100: Xx = 2.5 Yy = 2.5 elif x_max < 200 and len(steps) < 200: Xx = 5 Yy = 5 elif ix_max < 300 and len(steps) < 300: Xx = 8 Yy = 8 elif x_max < 400 and steps < 400: Xx = 10 Yy = 10 elif x_max < 500 and steps < 500: Xx = 12 Yy = 12 else: Xx = 15 Yy = 15 F.set_size_inches((DefaultSize[0]*Xx , DefaultSize[1]*Yy)) F.savefig('Out.png', bbox_inches='tight') pylab.close(F)
Stack Over
1

голосов
2

ответ
667

Просмотры

он-IDF с TfidfVectorizer на японском языке

Я работаю с огромной коллекцией документов, написанных на нескольких языках. Я хочу, чтобы вычислить расстояние косинуса между документами от их ТФ-IDF баллов. До сих пор я: от sklearn.feature_extraction.text импорта TfidfVectorizer # Документы расположены в той же папке, что и сценарий text_files = [r'doc1' , r'doc2' , r'doc3' ] файлы = [открыть (е) для F в text_files] = [документы f.read () для F в файлах] векторизатор = TfidfVectorizer (ngram_range = (1,1)) tfidf = vectorizer.fit_transform (документы) словарный запас = vectorizer.vocabulary_ Когда три документа doc1, doc2 и doc3 содержит английский текст, алгоритм работает как шарм и словарный запас действительно содержит юниграммы из различных органов текста. Я попытался с русским тоже, и он также работал большой. Однако, когда я пытаюсь с некоторым японским текстом, алгоритм не работает как задумано больше. Проблема возникает из-за того, что японский язык не имеет места, так что TfidfVectorizer не понимает, что это слово, а что нет. Например, я бы что-то подобное в моей Юниграмма словарем: 診 多 索 い ほ 権 込 真 べ ふ り 告 車 ク ノ 般 宮 え ぼ ぜ ゆ 注 携 ゆ ク く 供 9 時 ク 転 組 け が 意見 だ っ あ 税 新 ト復生 ひ り 教 台 話 辞 ゃ に Whic явно предложение, а не слово. Как я могу решить эту проблему?
Edgar Derby
1

голосов
2

ответ
349

Просмотры

Фильтр записи, прежде чем Django администратора оказывает данные модели

Итак, у меня есть модель с именем Foo. Мое требование, чтобы показать отфильтрованный список записей на администратор приборной панели для обува. В принципе, я хочу, чтобы фильтровать QuerySet еще до того, админ делает вид для обува. Есть ли способ сделать это? Моя среда: Джанго == 1.7, Python == 2,7 Я использую Grappelli, чтобы сделать свой сайт администратора.
Piyush Das
-2

голосов
3

ответ
25

Просмотры

Удалить элементы из массива Numpy меньше, чем 1

Я пытаюсь построить (50 миллионов значений) большие объемы данных, но я получаю MemoryError. Теперь я пытаюсь очистить свой набор данных из избыточных значений. В моем случае, все эти значения ниже 1 и выше -1. Одна вещь, чтобы иметь в виду, что сюжет должен выглядеть так же, как оригинал, но без шума. Есть ли лучший способ сделать это, чем с помощью петли или списковых? Оригинальный сюжет: Изменить: Спасибо за ответы. Если я использую предлагаемый подход: датый = датый [(- 1> DATY) | (Датый> 1)] Это приводит к следующим образом:
0

голосов
1

ответ
17

Просмотры

Обнаружен неизвестный тег «нагрузка».?

Я хочу добавить некоторые пользовательские-шаблонный tags.But, {% нагрузки userfilters%} => тег «нагрузка» не работает. settings.py # проект / settings.py ШАБЛОНЫ = [{ 'BACKEND': 'django.template.backends.jinja2.Jinja2', 'DIRS': [os.path.join (base_dir, 'HTML / jinja2'),] , 'APP_DIRS': true 'Options': { 'окружения': 'accountv1.jinja2.environment',},},] jinja2.py # проект / jinja2.py от django.templatetags.static импорта статического из django.urls импорт реверсивная из jinja2 импорта окружающей среды четкости среды (** опция): окр = Environment (** опции) env.globals.update ({ 'статическими': статические, 'URL': реверс,}) возвращает окр приложение / templatetags / userfilters ,
user10827542

Просмотр дополнительных вопросов